3.1. დისპერსია

მონაცემთა დისპერსია ასაშუალოებს მონაცემთა დაშორებას მათი საშუალო მნიშვნელობიდან. ცალკე საკითხია როგორ გავზომოთ მონაცემიდან საშუალომდე ეს დაშორება: თუკი თითოეულ მონაცემს გამოვაკლებთ საშუალო მნიშვნელობას, შედეგებს დავაჯამებთ და გავყოფთ რაოდენობაზე, აღმოვაჩენთ, რომ ეს სიდიდე ყოველთვის $ 0 $-ის ტოლი იქნება (ამაზე წინა თავშიც ვისაუბრეთ). მაგრამ თუკი ამ სხვაობებს კვადრატში ავიყვანთ და მერე გავასაშუალოებთ, მაშინ მიღებული სიდიდე დადებითი იქნება და ბუნებრივია, რომ რაც უფრო დაშორებული იქნება მონაცემები საკუთარ საშუალოს, მით მეტი იქნება ის. სწორედ ამ სიდიდეს ეწოდება პოპულაციის დისპერსია და, როგორც სახელწოდებაც მიგვანიშნებს, ის გამოითვლება იმ შემთხვევაში, როცა მოცემულია პოპულაციური მონაცემები.

რაიმე $ x_i $ პოპულაციური მონაცემებისთვის ($ i=1,2,…,N $) პოპულაციის დისპერსია წარმოადგენს საშუალოდან გადახრათა კვადრატების არითმეტიკულ საშუალოს: $$ \sigma^2_x=\frac{\sum^{N}_{i=1}(x_i-\mu)^2}{N} $$ სადაც $ \mu $ პოპულაციის საშუალოა, ხოლო $ N $ კი – მონაცემთა რაოდენობა პოპულაციაში.

მაშინ, როცა მოცემულია შერჩევა, საშუალოდან გადახრების კვადრატების გასაშუალოება ხორციელდება არა მონაცემთა მთლიან რაოდენობაზე გაყოფით, არამედ $ (n – 1) $-ზე გაყოფით, სადაც $ n $ შერჩევის ზომაა (ამას საკუთარი მიზეზი გააჩნია, რომელიც სტატისტიკური მაჩვენებლების ასიმპტოტურ თვისებებს უკავშირდება და მასზე საუბარი შორს წაგვიყვანს).

რაიმე $ x_i $ შერჩევითი მონაცემებისთვის ($ i=1,2,…,n $) შერჩევის დისპერსია წარმოადგენს საშუალოდან გადახრათა კვადრატების ჯამს გაყოფილს მონაცემთა რაოდენობას მინუს ერთზე: $$ s^2_x=\frac{\sum^{n}_{i=1}(x_i-\bar{x})^2}{n-1} $$ სადაც $ \bar{x} $ შერჩევის საშუალოა, ხოლო $ n $ კი – მონაცემთა რაოდენობა შერჩევაში.

მაგალითი. დავუშვათ, მოცემულია $ 5 $ მონაცემისგან შემდგარი პოპულაცია:

$$ 6.35 0.1 6.76 5.66 2.14 $$

დავითვალოთ დისპერსია.

ამოხსნა. დისპერსიის გამოსათვლელად ჯერ საჭიროა პოპულაციის საშუალოს დადგენა. იგი უდრის $ 4.202 $-ს. მისი გამოყენებით დისპერსია ტოლი იქნება შემდეგი სიდიდის:

$$ \frac{(6.35-4.202)^2+(0.1-4.202)^2+(6.76-4.202)^2+(5.66-4.202)^2+(2.14-4.202)^2}{5}=\frac{34.36128}{5}=6.872256. $$

თუ მოცემული მონაცემები შერჩევა იქნებოდა, მაშინ რამდენადაც საშუალოდან გადახრათა კვადრატების ჯამი უკვე გამოთვლილი გვაქვს, შერჩევის დისპერსიის გამოსათვლელად მრიცხველს გავყოფდით არა $ 5 $-ზე, არამედ $ 4 $-ზე:

$$ \frac{34.36128}{4}=8.59032. $$