3.4. მონაცემთა შორის დამოკიდებულების საზომები: კოვარიაცია და კორელაცია

ამ ქვეთავში განვიხილავთ მონაცემთა შორის წრფივი დამოკიდებულების რიცხობრივი საზომებს: კოვარიაციასა და კორელაციას. თუ პირველი მათგანი ასახავს ორ მონაცემთა დალაგებულ სიმრავლეს შორის წრფივი დამოკიდებულების მიმართულებას (ზრდადი ან კლებადი), მეორე მათგანი მიმართულების გარდა დამოკიდებულების სიძლიერეზე გვაძლევს წარმოდგენას. აქამდე ვიხილავდით მონაცემებს, რომელიც წარმოადგენდა ერთ კონკრეტულ ფენომენზე დაკვირვებულ მნიშვნელობებს. თუმცა, ხშირად დგება საჭიროება ერთდროულად ორ (ან რამდენიმე) ფენომენზე დაკვირვებული […]

3.3. ვარიაციის კოეფიციენტი

დავუშვათ, გასულ წელს რაიმე A აქციის ფასი საშუალოდ $ \$50 $ იყო, ხოლო სტანდარტული გადახრა კი $ \$5 $. ასევე დავუშვათ, რომ რაიმე B აქციას იგივე სტანდარტული გადახრა გააჩნია, რაც A აქციას, მაგრამ მისი საშუალო ფასი ორჯერ მეტი – $ \$100 $ იყო. შეიძლება ითქვას, რომ გამომდინარე სტანდარტული გადახრების ტოლობიდან, ორივე აქცია თანაბარ რისკიანია? რასაკვირველია, […]

3.2. სტანდარტული გადახრა

წინა ქვეთავში განხილული დისპერსიის გამოთვლისას საშუალოდან გადახრები კვადრატში ადის, რაც დისპერსიას ანიჭებს მონაცემებისგან განსხვავებულ ზომის ერთეულს. მაგალითად, თუ მონაცემები ლარებშია მოცემული, დისპერსიის ზომის ერთეული “ლარი კვადრატში” იქნება და, შესაბამისად, მისი რიცხობრივი მნიშვნელობა სრულიად უშინაარსო და არასათანადო სიდიდე გამოვა რაიმე სტატისტიკური დასკვნის გასაკეთებლად. ამიტომ განიხილავენ გაფანტულობის კიდევ ერთ საზომს, სტანდარტულ გადახრას, რომელიც გამოითვლება როგორც დადებითი კვადრატული […]

3.1. დისპერსია

მონაცემთა დისპერსია ასაშუალოებს მონაცემთა დაშორებას მათი საშუალო მნიშვნელობიდან. ცალკე საკითხია როგორ გავზომოთ მონაცემიდან საშუალომდე ეს დაშორება: თუკი თითოეულ მონაცემს გამოვაკლებთ საშუალო მნიშვნელობას, შედეგებს დავაჯამებთ და გავყოფთ რაოდენობაზე, აღმოვაჩენთ, რომ ეს სიდიდე ყოველთვის $ 0 $-ის ტოლი იქნება (ამაზე წინა თავშიც ვისაუბრეთ). მაგრამ თუკი ამ სხვაობებს კვადრატში ავიყვანთ და მერე გავასაშუალოებთ, მაშინ მიღებული სიდიდე დადებითი იქნება […]

3. მონაცემთა გაბნევისა და ურთიერთკავშირის მახასიათებლები

შესავალი მიუხედავად იმისა, რომ წინა თავში განხილული გაბნევისა და კვარტილური დიაპაზონები მონაცემთა გაბნევის, გაფანტულობის საზომად გამოიყენება, მათი მნიშვნელობა მხოლოდ ორ სიდიდეზეა დამოკიდებული: გაბნევის დიაპაზონის შემთხვევაში მინიმალურ და მაქსიმალურ მნიშვნელობებზე, ხოლო კვარტილური დიაპაზონის შემთხვევაში კი – პირველ და მესამე კვარტილზე. ასეთ მცირე რაოდენობის მონაცემებზე დაყრდნობა რისკს შეიცავს: გვექმნება არასრული წარმოდგენა მონაცემთა ცვალებადობისა და მერყეობის შესახებ (წარმოიდგინეთ […]