BLOGS

8. დისკრეტული ალბათური განაწილებები

შესავალი წინა თავში ზოგადად განვიხილეთ დისკრეტული შემთხვევითი ცვლადი და ვისაუბრეთ მის არსსა და მახასიათებლებზე. ამ თავში კი ისეთ ცვლადებს გავეცნობით, რომელთაც სპეციფიური ალბათური განაწილება გააჩნია.

წაიკითხე მეტი »

7.9. შემთხვევითი ცვლადების ჯამის საშუალო და დისპერსია

დავუშვათ, მოცემულია ორი შემთხვევითი ცვლადი \( X \) და \( Y \). მაშინ სამართლიანია შემდეგი ტოლობები: $$ E(X+Y)=E(X)+E(Y) \tag{1}$$ $$ E(aX+bY)= aE(X)+bE(Y) \tag{2} $$ $$

წაიკითხე მეტი »

7.8. შემთხვევითი ცვლადის წრფივი ფუნქციის საშუალო, დისპერსია და სტანდარტული გადახრა

დავუშვათ, წინა ქვეთავში განხილულ მაგალითში პროექტის მენეჯერს სურს შეაფასოს მოსალოდნელი ხარჯი. მან უწყის, რომ პროექტის შესასრულებლად შესყიდულ უნდა იქნას 25,000 ლარის ღირებულების მასალა და ამასთან,

წაიკითხე მეტი »

7.7. დისკრეტული შემთხვევითი ცვლადის გაფანტულობის საზომები

ადრე ვიხილეთ, რომ მონაცემთა პოპულაციის გაფანტულობის ერთ-ერთი კარგი საზომია დისპერსია, რომელიც საშუალოდან გადახრათა კვადრატების საშუალოს წარმოადგენს. შემთხვევითი ცვლადისთვისაც ჩვენ განვსაზღვრავთ ანალოგიურ სიდიდეს, რომელიც იქნება მისი

წაიკითხე მეტი »

7.6. დისკრეტული შემთხვევითი ცვლადის საშუალო

სალექციო კურსის ერთ-ერთ საწყის თემაში ჩვენ განვიხილეთ მონაცემთა სიმრავლის დამახასიათებელი სიდიდეები, კერძოდ, ცენტრალური ტენდენციისა და გაფანტულობის საზომები. ამჟამად ჩვენი მიზანია განვსაზღვროთ იგივე ტიპის საზომები დისკრეტული

წაიკითხე მეტი »

7.5. კავშირი კუმულატიური ალბათობის ფუნქციასა და ალბათობის ფუნქციას შორის

დავუშვათ, \( X \) წარმოადგენს რაიმე შემთხვევით დისკრეტულ ცვლადს კუმულატიური ალბათობის ფუნქციით \( F(x) \) და ალბათობის ფუნქციით \( f(x) \). მაშინ ადვილი საჩვენებელია, რომ

წაიკითხე მეტი »

ასოცირების დასაჯერობა

(ინგლ. association confidence): სიდიდე, რომლითაც ფასდება რამდენად მოსალოდნელია ასოცირების წესით მოცემული წინაპირობის შემთხვევაში მოცემული შედეგის დადგომა.

მეტი »

ასოცირების ეფექტიანობა

(ინგლ. lift ratio): სიდიდე, რომელიც აფასებს რამდენად გამოსადეგია ასოცირების წესი ასოცირების შედეგის წინასწარმეტყველებისთვის მოცემულ წინაპირობაზე დაყრდნობით.

მეტი »

ასოცირების შედეგი

(ინგლ. consequent): ასოცირების წესის ის ნაწილი, რომელიც შეესაბამება წინაპირობის ჭეშმარიტობის შემთხვევაში დამდგარ ფაქტს.

მეტი »

ასოცირების წესები

(ინგლ. association rules): წესები, რომლებიც ეფუძნება პირობით განცხადებებს მომხმარებელთა მიერ განხორციელებულ ტრანზაქციებთან მიმართებაში. ისინი ალბათური ტიპის სტრუქტურის მქონეა და აღწერს წინაპირობასა და შედეგს შორის კავშირს.

მეტი »

ასოცირების წინაპირობა

(ინგლ. antecedent): ის კრიტერიუმი ასოცირების წესში, რომელზე დაყრდნობითაც დგება შედეგი მომხმარებლის მიერ განხორციელებულ ქმედებაში (ტრანზაქციაში, შენაძენში).

მეტი »

დოკუმენტი

(ინგლ. document): ტექსტის მაინინგის პროცესში ანალიზის ცალკეული ობიექტი, ტექსტური ერთეული.

მეტი »

ევკლიდური მანძილი

(ინგლ. euclidean distance): გამოიყენება რაოდენობრივ დაკვირვებათა შორის განსხვავებულობის (ან მსგავსების) გასაზომად. იგი გამოითვლება დაკვირვების კომპონენტებს შორის სხვაობათა კვადრატების ჯამიდან ფესვის ამოღებით.

მეტი »

იერარქიული დაჯგუფება

(ინგლ. hierarchical clustering): წარმოადგენს კლასტერული ანალიზის ერთ-ერთ მეთოდს. მისი მეშვეობით დაკვირვებები ეტაპობრივად ჯგუფდება კლასტერებში. დაჯგუფება იწყება ვიწრო კლასტერებში და გრძელდება მათი აგრეგირებით შედარებით ფართო კლასტერებში (იგივე “ქვემოდან-ზემოთ” მიდგომა).

მეტი »

კლასტერული ანალიზი

(ინგლ. cluster analysis): დაკვირვებათა დაჯგუფების პროცესი, რომლის მეშვეობითაც, მოგროვებულ მონაცემებსა და მათ შორის მსგავსების (ან განსხვავებულობის) წესზე დაყრდნობით, ჯგუფში ხვდება მსგავსი დაკვირვებები. ამ ჯგუფებს კლასტერები ეწოდება.

მეტი »

მარკირება

ინგლ. tokenization. ტექსტის მაინინგის ერთ-ერთი საწყისი ეტაპი, რომლის დროსაც დასამუშავებელი ტექსტური ინფორმაცია აღიწერება სინონიმების ცნებაზე დაყრდნობით, საერთო განზოგადებული ტერმინების (მარკერების) საშუალებით.

მეტი »

მხოლობითი ბმა

(ინგლ. single linkage): კლასტერულ ანალიზში იერარქიული დაჯგუფების მეთოდი, რომლის მიხედვით ორი კლასტერის გაერთიანება დამოკიდებულია იმაზე, თუ რამდენად მსგავსია ყველაზე ახლოს მდგარი ორი დაკვირვება (თითო დაკვირვება თითოეული კლასტერიდან).

მეტი »

სრული ბმა

(ინგლ. complete linkage): კლასტერულ ანალიზში იერარქიული დაჯგუფების მეთოდი, რომლის მიხედვით ორი კლასტერის გაერთიანება დამოკიდებულია იმაზე, თუ რამდენად მსგავსია ყველაზე შორს მდგარი ორი დაკვირვება (თითო დაკვირვება თითოეული კლასტერიდან).

მეტი »

სტატისტიკა

(ინგლ. statistics): არის მეცნიერება, რომელიც შეისწავლის მონაცემების შეგროვების, წარმოდგენის, ანალიზისა და ახსნის წესებს.

მეტი »

ტერმინების სიხშირული მატრიცა

(ინგლ. frequency term-document matrix) ცხრილი, რომელიც აიგება ტექსტის მაინინგის პროცესში და ასახავს სხვადასხვა ტერმინის სიხშირეს (ტერმინის განმეორებათა რაოდენობას) ტექსტურ ერთეულებში (დოკუმენტებში).

მეტი »