2.2. ცენტრალური ტენდენციის მახასიათებელები: მედიანა და მოდა

დავუბრუნდეთ ზემოთ განხილულ მაგალითს ბათუმში ბინების ქირის ფასის შესახებ. დავუშვათ, მოყვანილ მონაცემებში უძრავი ქონების აგენტს გამორჩა ერთი ბინის ქირა $4620$ ლარის ოდენობით: $$910, 950, 950, 980, 1020, 1070, 4620$$

ამის გათვალისწინებით საშუალო ქირა ბევრად მეტი, $1500$ ლარი გამოდის: $$ \frac{910+950+950+980+1020+1070+4620}{7}=1500$$

თუმცა, ეს რიცხვი უკვე ფასებზე არასწორი წარმოდგენის მომცემია: ფაქტიურად, არსებულ ბინებში მხოლოდ ერთს გააჩნია $1500$ ლარზე მეტი ქირა, როცა დანარჩენ ბინებს მასზე გაცილებით ნაკლები დაქირავების ხარჯი აქვთ! ე.ი. ახლად გამოთვლილი საშუალო მნიშვნელობა მონაცემებს მართებულად ვეღარ აღწერს. ალბათ კარგად ჩანს, რომ ასეთი ვითარება განსაკუთრებით იმ შემთხვევაში დგება ხოლმე, როცა მონაცემთა ჯგუფში სიდიდით ძლიერ განსხვავებული რიცხვია (რიცხვებია) გამორეული. ამგვარ მონაცემს ამოვარდნილ (განკერძოებულ, ექსტრემალურ) სიდიდეს უწოდებენ ხოლმე. ასეთ დროს, როგორც წესი, ორი გზა არსებობს ცენტრალური ტენდენციის გასაგებად: მონაცემებს უნდა ჩამოვაშოროთ ამოვარდნილი სიდიდეები და შემდეგ გამოვთვალოთ საშუალო ან საშუალოს მაგივრად პირდაპირ გამოვთვალოთ მედიანა. სკოლის სასწავლო მასალიდან ალბათ გახსოვთ მედიანის განმარტება:

მოცემულ შერჩევასა ან პოპულაციაში მედიანა არის რიცხვი, რომლის მარცხნივ და მარჯვნივ ზრდადობით ან კლებადობით დალაგებულ მონაცემთა თანაბარი რაოდენობაა განთავსებული.

ჩვენს მაგალითში მედიანა იქნება ზუსტად შუაში მდგომი მონაცემი – $980$. შევნიშნოთ, რომ მედიანის ძიების დაწყებამდე უნდა დავრწმუნდეთ, რომ მონაცემთა ჯგუფი ზრდადობით (ან კლებადობით) არის დალაგებული. წინააღმდეგ შემთხვევაში, ჯერ დალაგება უნდა განვახორციელოთ და შემდგომ უნდა ვიპოვოთ მედიანა.

მაგალითი. ქვემოთ მოცემულია „მერსედესის“ მარკის $5$ ავტომობილის ბენზინის მოხმარების მაჩვენებლები $100$ კმ-ზე, ლიტრებში: $$9.3, 6.2, 8.5, 7.7, 16.9$$

იპოვეთ მედიანა.

ამოხსნა. რამდენადაც მონაცემები არც ზრდადობით და არც კლებადობითაა დალაგებული, ჯერ უნდა განვახორციელოთ მათი დალაგება. ზრდადობით დალაგებულ ჯგუფს ექნება შემდეგი მიმდევრობა: $$6.2, 7.7, 8.5, 9.3, 16.9$$

მედიანა იქნება შუაში მდგომი $8.5$. კლებადობით დალაგების შემთხვევაშიც, ცხადია, იგივე შედეგს მივიღებდით. 

როცა მონაცემთა რაოდენობა კენტია, მედიანის ძიების პრობლემა ადვილი გადასაჭრელია: მაგალითად, $5$ დალაგებულ მონაცემში მედიანა ყოველთვის მე-$3$-ეა, $15$-ში მე-$8$ და ა.შ. როგორ მოვიქცეთ, როცა მონაცემთა რაოდენობა ლუწია? ასეთ დროს ირჩევენ შუა ორ მონაცემს, პოულობენ მათ საშუალო არითმეტიკულს და მიღებულ შედეგს უწოდებენ მედიანას.

მაგალითი. ავიაკომპანია „პეგასუსის“ ბილეთების ფასი თბილისი – სტამბული – თბილისის რეისზე უკანასკნელი $8$ თვის მანძილზე (რეისის წინა დღეს) შემდეგი იყო: $$98.7, 70.5, 84.6, 87.5, 102.6, 65.5, 140.8, 80.3$$

იპოვეთ მედიანა.

ამოხსნა. დავალაგოთ მწკრივი კლებადობით: $$140.8, 102.6, 98.7, 87.5, 84.6, 80.3, 70.5, 65.5$$

მონაცემთა რაოდენობა ლუწია, ხოლო შუაში მდგომი ორი მონაცემია $87.5$ და $84.6$. მათი საშუალო არითმეტიკულია 86.05, რაც მედიანის ტოლია. 

თუ შერჩევის (ან პოპულაციის) ზომა $n$ კენტია, მაშინ მედიანა უშუალოდ შუა მონაცემია, ხოლო თუ შერჩევის ზომა ლუწია, მაშინ მედიანა წარმოადგენს ორი შუაში მდგარი მონაცემის საშუალო არითმეტიკულს. დალაგებულ ჯგუფში მედიანა ყოველთვის განთავსებულია $0.5(n + 1)$-ე პოზიციაზე. მაგალითად, თუკი პოზიცია უდრის $ 17.5 $-ს, მაშინ მედიანა მე-17 და მე-18 მონაცემთა საშუალოა.

ცენტრალური ტენდენციის კიდევ ერთ საზომად იყენებენ ხოლმე მოდას. იგი წარმოადგენს მონაცემთა ჯგუფში ყველაზე ხშირად განმეორებად მონაცემს. 

მაგალითი. დავუშვათ, ტანსაცმლის მაღაზიის მფლობელს აინტერესებს რომელი ზომის შარვალი იყიდება ყველაზე ხშირად. ამისათვის მას შეუძლია გადახედოს უკანასკნელ დღეს რეალიზებული შარვლების ზომებს: $$45, 42, 38, 42, 40, 46, 41, 42, 39, 43, 42$$

ამოხსნა. როგორც ვხედავთ, ყველაზე ხშირად განმეორებადი მონაცემია $42$ – იგი ჯგუფში ოთხჯერ გვხვდება. სწორედ ის წარმოადგენს მოცემული მონაცემთა ჯგუფისთვის მოდას. 

მოდა ეწოდება შერჩევასა ან პოპულაციაში ყველაზე ხშირად განმეორებად მონაცემს.

შესაძლებელია, მონაცემთა ჯგუფში რამდენიმე მოდა არსებობდეს ერთდროულად (ან საერთოდ არ არსებობდეს). ორი მოდის არსებობის შემთხვევაში მონაცემთა ჯგუფზე ამბობენ, რომ იგი ბიმოდალურია, უფრო მეტის არსებობის შემთხვევაში კი – მულტიმოდალური.