3. მონაცემთა გაბნევისა და ურთიერთკავშირის მახასიათებლები

შესავალი

მიუხედავად იმისა, რომ წინა თავში განხილული გაბნევისა და კვარტილური დიაპაზონები მონაცემთა გაბნევის, გაფანტულობის საზომად გამოიყენება, მათი მნიშვნელობა მხოლოდ ორ სიდიდეზეა დამოკიდებული: გაბნევის დიაპაზონის შემთხვევაში მინიმალურ და მაქსიმალურ მნიშვნელობებზე, ხოლო კვარტილური დიაპაზონის შემთხვევაში კი – პირველ და მესამე კვარტილზე. ასეთ მცირე რაოდენობის მონაცემებზე დაყრდნობა რისკს შეიცავს: გვექმნება არასრული წარმოდგენა მონაცემთა ცვალებადობისა და მერყეობის შესახებ (წარმოიდგინეთ ვითარება, როცა გვაქვს ათასობით მონაცემი და მათ მერყეობას მხოლოდ მაქსიმუმითა და მინიმუმით ვახასიათებთ). შესაბამისად, გვესაჭიროება ისეთი საზომი, რომელიც მონაცემთა გაფანტულობის შეფასებისას გამოიყენებდა მეტ დაკვირვებას. ასეთია დისპერსია, სტანდარტული გადახრა და ვარიაციის კოეფიციენტი და მოცემულ თავში სწორედ მათ განვიხილავთ.

გარდა ამისა, ვისაუბრებთ მონაცემთა სიმრავლეებს შორის სტატისტიკურ კავშირზე. მაგალითად, დავინტერესდებით სტატისტიკურად რამდენად კავშირშია ზაფხულის დღიური ტემპერატურა და ნაყინის გაყიდვის მაჩვენებელი, ან ბინის ფასი და სართული. ამისათვის განვიხილავთ კოვარიაციისა და კორელაციის კოეფიციენტებს.