1. სტატისტიკის საწყისი ცნებები

შესავალი

სტატისტიკას უდიდესი გამოყენება აქვს თითქმის ყველა დარგში, მაგრამ მისი საჭიროება განსაკუთრებით ბიზნესსა და ეკონომიკაში ჩანს. საქმე იმაშია, რომ ბიზნესსა და ეკონომიკაში მენეჯერული გადაწყვეტილებები ხშირად მიიღება ისეთ ინფორმაციაზე დაყრდნობით, რომელიც არასრულია, ანუ – გაურკვევლობის პირობებში. მაგალითად, წარმოვიდგინოთ, რომ გადაწყვეტილების მიმღებ პირთა წინაშე დგას კითხვა უნდა გაფართოვდეს თუ არა კომპანია ახალ რეგიონებში, ან უნდა შეიზღუდოს თუ არა უცხოური ვალუტით სესხების გაცემა ქვეყანაში. ბუნებრივია, ამ კითხვებზე ისეთი პასუხის გაცემა, რომელიც 100%-იანი სიზუსტის გარანტიას მოგვცემს, უაღრესად რთულია და უფრო მართებულნი ვიქნებით, თუ ვიტყვით, რომ შეუძლებელიცაა. რატომ? იმიტომ, რომ თუნდაც კომპანიის გაფართოებაზე მსჯელობისას, გასათვალისწინებელია უამრავი ფაქტორი, რამაც შესაძლოა გავლენა მოახდინოს ახალ რეგიონში გახსნილი ფილიალის წარმატებასა და წარუმატებლობაზე. ამ მხრივ მნიშვნელოვანია ის სპეციფიური ბიზნეს დანახარჯები, რომელიც ამ რეგიონისთვისაა დამახასიათებელი და კავშირშია, მაგალითად, რეგულაციებთან, მომხმარებელთა შემოსავალთან და მათ გარკვეულ კულტურულ ნიუანსებთან, გემოვნებასთან და ა.შ. ცხადია, რომ ამ ყველაფრის წინასწარ გათვლა შეუძლებელია, რის გამოც საბოლოო გადაწყვეტილება მაქსიმალურად ხელმისაწვდომ, მაგრამ არასრულ ინფორმაციაზე დაყრდნობით მიიღება. სტატისტიკა სწორედაც რომ გვეხმარება ამგვარი გადაწყვეტილებების მიღების პროცესში ჩავრთოთ დამატებითი ინფორმაცია – მონაცემთა მოგროვების, ანალიზისა და ინტერპრეტაციის გზით.

სტატისტიკა არის მეცნიერება, რომელიც შეისწავლის მონაცემების შეგროვების, წარმოდგენის, ანალიზისა და ახსნის წესებს.

სტატისტიკა ისევე, როგორც ყველა სხვა მეცნიერება, ეფუძნება გარკვეულ საწყის ცნებებს, რომლის გააზრებაც თავიდანვე აუცილებელია. პირველი ასეთი ცნებებია პოპულაცია და შერჩევა. მაგალითად, როდესაც ვაპირებთ პატარა ქალაქში სანაყინის გახსნას და გვსურს დავადგინოთ რამდენად იქნება მოთხოვნა ჩვენს პროდუქციაზე, შეგვიძლია ჩავატაროთ ამ ქალაქის მოსახლეობის გამოკითხვა. თუკი ამ გამოკითხვაში მონაწილეობას მიიღებს ყველა მოსახლე, მაშინ ამბობენ, რომ მიღებული პასუხები წარმოადგენს პოპულაციას. თუმცა თუკი მოსახლეობიდან შევარჩევთ მხოლოდ ნაწილს და მათ პასუხებს შევაგროვებთ, შედეგად მივიღებთ შერჩევას.

პოპულაცია არის მკვლევარის ინტერესის სფეროში მყოფი ობიექტების სრული ერთობლიობა.

პოპულაციის ზომა, რომელიც აღინიშნება ხოლმე \( N \) სიმბოლოთი, შეიძლება იყოს ძალიან დიდი ან უსასრულოც კი.

შერჩევა წარმოადგენს პოპულაციის ქვესიმრავლეს, მის გარკვეულ ნაწილს.

შერჩევის ზომა, როგორც წესი, აღინიშნება \( n \)-ით.

მოვიყვანოთ დამატებით კიდევ რამდენიმე მაგალითი. სუპერმარკეტის ყველა თანამშრომლისგან შემდგარი ერთობლიობა პოპულაციაა, ხოლო მათგან რაიმე წესით შერჩეული რამდენიმე თანამშრომელი კი წარმოადგენს შერჩევას. ანალოგიურად, ილიას სახელმწიფო უნივერსიტეტში მოსწავლე ყველა სტუდენტი ქმნის პოპულაციას, ხოლო, დავუშვათ, იმ ნაწილს, რომლის სახელი იწყება ა-ზე, შეგვიძლია ვუწოდოთ შერჩევა. კიდევ ერთი მაგალითი: ხელოვნურ ტბაში მოშენებული ყველა თევზი ქმნის პოპულაციას, ხოლო დღის განმავლობაში დაჭერილი თევზები უკვე შერჩევაა.

შევნიშნოთ, რომ ხშირად პოპულაციური მონაცემების მოგროვება ძალიან ხარჯიანი (დროისა და ფინანსების კუთხით) და გარკვეულ შემთხვევებში შეუძლებელიცაა: ქალაქის ყველა მოსახლესთან ან უნივერსიტეტის ყველა სტუდენტთან მისვლა და მისი აზრის გაგება არაა ადვილი საქმე – მითუმეტეს, რომ მათგან ბევრმა შესაძლოა უარიც კი თქვას გამოკითხვაში მონაწილეობაზე. ამიტომ შერჩევა უფრო მოსახერხებელია, თუმცა გასათვალისწინებელია ერთი რამ: შერჩევა უნდა იყოს წარმომადგენლობითი! ეს ნიშნავს იმას, რომ შერჩევით მიღებული შედეგები კარგად უნდა ასახავდეს მთლიან პოპულაციას. ანუ თუკი უნივერსიტეტიდან შევარჩევთ 100 სტუდენტს, მათი გამოკითხვით მიღებული მონაცემები შორს არ უნდა იდგეს იმ მონაცემებისგან, რომელსაც მივიღებდით მაშინ, თუკი მთლიან უნივერსიტეტს გამოვკითხავდით. როგორ უზრუნველვყოთ ეს?

ზემოთ მოცემულ კითხვაზე ზოგადი პასუხია ასეთია:

  1. შერჩევის ზომა, \( n \), ცხადია, არ უნდა იყოს ძალიან მცირე, ვიდრე პოპულაციის ზომა, \( N \), მაგრამ არ არის აუცილებელი სიდიდით იყოს მასთან ახლოს. როგორც წესი, 100-დან 500-მდე ერთეული სრულიად საკმარისია ხოლმე, თუმცა გასათვალისწინებელია ბევრი სხვა ნიუანსიც, რაზეც აქ არ ვისაუბრებთ;
  2. სავალდებულოა, რომ გაკეთდეს მარტივი შემთხვევითი შერჩევა, რომელიც წარმოადგენს იმგვარი წესით გაკეთებულ შერჩევას, რომ მის თითოეულ წევრს ჰქონდეს პოპულაციიდან ამორჩევის თანაბარი შანსი. ეს ფაქტიურად ნიშნავს იმას, რომ, მაგალითად, როდესაც პოპულაციას წარმოადგენს პენსიონრები, მათ შორის შერჩევისას არ მივანიჭოთ უპირატესობა სქესს, ასაკს, ან სხვა რაიმე მახასიათებელს. ანუ შერჩევა არ უნდა იყოს მიკერძოებული.

ახლა განვიხილოთ პარამეტრისა და სტატისტიკური მაჩვენებლის ცნებები.

პარამეტრი არის პოპულაციის კონკრეტული მახასიათებელი.

მაგალითად, თუკი მოცემული გვაქვს კომერციული ბანკის კლიენტთა პოპულაციური მონაცემები მათ შემოსავალზე, მაშინ ამ მონაცემების საშუალო მნიშვნელობა იქნება პარამეტრი. პარამეტრი იქნება ასევე ნებისმიერი სხვა სიდიდე, რომელსაც ამ მონაცემებისგან გამოვთვლით: მაქსიმუმი, მინიმუმი, მედიანა, მოდა და ა.შ.

სტატისტიკური მაჩვენებელი არის შერჩევის კონკრეტული მახასიათებელი.

მაგალითად, ბანკის იმ კლიენტთა საშუალო შემოსავალი, რომელთა სახელი იწყება ა-ზე, იქნება სტატისტიკური მაჩვენებელი, რადგან ის გამოთვლილ იქნება შერჩევით მონაცემებზე დაყრდნობით.

და ბოლოს: სტატისტიკა, როგორც მეცნიერება, იყოფა ორ ნაწილად.

აღწერითი სტატისტიკა მოიცავს გრაფიკულ და რიცხობრივ მეთოდებს, რომლებიც გამოიყენება მონაცემთა შეჯამებისა და დამუშავებისათვის – მათი ინფორმაციად გარდაქმნის მიზნით.

დასკვნითი სტატისტიკა წარმოადგენს პროგნოზებისა და შეფასებების საფუძველს, რომელიც გამოიყენება ინფორმაციის ცოდნად გარდაქმნისათვის.

ჩვენ სტატისტიკის შესწავლას აღწერითი სტატისტიკით დავიწყებთ.