BLOGS

#სტატისტიკისბლოგი
Davit Tutberidze

1.2. რომელი ფუნქციები გამოიყენება სიხშირული განაწილებისთვის Google Sheets-ში?

Google Sheets-ში მონაცემთა სიხშირული განაწილების აგება, ყველაზე მარტივად, შესაძლებელია FREQUENCY ფუნქციის მეშვეობით. თუმცა მანამდე უნდა დავადგინოთ ინტერვალები. დავუშვათ, მონაცემები მოცემულია A2:A20 უჯრებში: ასევე, დავუშვათ, რომ

წაიკითხე მეტი »
#სტატისტიკისბლოგი
Davit Tutberidze

1.1. მონაცემთა ტიპები. მონაცემთა რიცხობრივი და გრაფიკული წარმოდგენა

მონაცემები, რომელთა დამუშავება და ანალიზიც ხორციელდება სტატისტიკური მეთოდებით, შეგვიძლია ორ ტიპად დავყოთ: რაოდენობრივი – ასეთი მონაცემები იძლევა ინფორმაციას რაიმეს რაოდენობის შესახებ. მაგალითად, სტუდენტთა რაოდენობები უნივერსიტეტის

წაიკითხე მეტი »
#სტატისტიკისბლოგი
Davit Tutberidze

1. სტატისტიკის საწყისი ცნებები

შესავალი სტატისტიკას უდიდესი გამოყენება აქვს თითქმის ყველა დარგში, მაგრამ მისი საჭიროება განსაკუთრებით ბიზნესსა და ეკონომიკაში ჩანს. საქმე იმაშია, რომ ბიზნესსა და ეკონომიკაში მენეჯერული გადაწყვეტილებები ხშირად

წაიკითხე მეტი »

ასოცირების დასაჯერობა

(ინგლ. association confidence): სიდიდე, რომლითაც ფასდება რამდენად მოსალოდნელია ასოცირების წესით მოცემული წინაპირობის შემთხვევაში მოცემული შედეგის დადგომა.

მეტი »

ასოცირების ეფექტიანობა

(ინგლ. lift ratio): სიდიდე, რომელიც აფასებს რამდენად გამოსადეგია ასოცირების წესი ასოცირების შედეგის წინასწარმეტყველებისთვის მოცემულ წინაპირობაზე დაყრდნობით.

მეტი »

ასოცირების შედეგი

(ინგლ. consequent): ასოცირების წესის ის ნაწილი, რომელიც შეესაბამება წინაპირობის ჭეშმარიტობის შემთხვევაში დამდგარ ფაქტს.

მეტი »

ასოცირების წესები

(ინგლ. association rules): წესები, რომლებიც ეფუძნება პირობით განცხადებებს მომხმარებელთა მიერ განხორციელებულ ტრანზაქციებთან მიმართებაში. ისინი ალბათური ტიპის სტრუქტურის მქონეა და აღწერს წინაპირობასა და შედეგს შორის კავშირს.

მეტი »

ასოცირების წინაპირობა

(ინგლ. antecedent): ის კრიტერიუმი ასოცირების წესში, რომელზე დაყრდნობითაც დგება შედეგი მომხმარებლის მიერ განხორციელებულ ქმედებაში (ტრანზაქციაში, შენაძენში).

მეტი »

დოკუმენტი

(ინგლ. document): ტექსტის მაინინგის პროცესში ანალიზის ცალკეული ობიექტი, ტექსტური ერთეული.

მეტი »

ევკლიდური მანძილი

(ინგლ. euclidean distance): გამოიყენება რაოდენობრივ დაკვირვებათა შორის განსხვავებულობის (ან მსგავსების) გასაზომად. იგი გამოითვლება დაკვირვების კომპონენტებს შორის სხვაობათა კვადრატების ჯამიდან ფესვის ამოღებით.

მეტი »

იერარქიული დაჯგუფება

(ინგლ. hierarchical clustering): წარმოადგენს კლასტერული ანალიზის ერთ-ერთ მეთოდს. მისი მეშვეობით დაკვირვებები ეტაპობრივად ჯგუფდება კლასტერებში. დაჯგუფება იწყება ვიწრო კლასტერებში და გრძელდება მათი აგრეგირებით შედარებით ფართო კლასტერებში (იგივე “ქვემოდან-ზემოთ” მიდგომა).

მეტი »

კლასტერული ანალიზი

(ინგლ. cluster analysis): დაკვირვებათა დაჯგუფების პროცესი, რომლის მეშვეობითაც, მოგროვებულ მონაცემებსა და მათ შორის მსგავსების (ან განსხვავებულობის) წესზე დაყრდნობით, ჯგუფში ხვდება მსგავსი დაკვირვებები. ამ ჯგუფებს კლასტერები ეწოდება.

მეტი »

მარკირება

ინგლ. tokenization. ტექსტის მაინინგის ერთ-ერთი საწყისი ეტაპი, რომლის დროსაც დასამუშავებელი ტექსტური ინფორმაცია აღიწერება სინონიმების ცნებაზე დაყრდნობით, საერთო განზოგადებული ტერმინების (მარკერების) საშუალებით.

მეტი »

მხოლობითი ბმა

(ინგლ. single linkage): კლასტერულ ანალიზში იერარქიული დაჯგუფების მეთოდი, რომლის მიხედვით ორი კლასტერის გაერთიანება დამოკიდებულია იმაზე, თუ რამდენად მსგავსია ყველაზე ახლოს მდგარი ორი დაკვირვება (თითო დაკვირვება თითოეული კლასტერიდან).

მეტი »

სრული ბმა

(ინგლ. complete linkage): კლასტერულ ანალიზში იერარქიული დაჯგუფების მეთოდი, რომლის მიხედვით ორი კლასტერის გაერთიანება დამოკიდებულია იმაზე, თუ რამდენად მსგავსია ყველაზე შორს მდგარი ორი დაკვირვება (თითო დაკვირვება თითოეული კლასტერიდან).

მეტი »

სტატისტიკა

(ინგლ. statistics): არის მეცნიერება, რომელიც შეისწავლის მონაცემების შეგროვების, წარმოდგენის, ანალიზისა და ახსნის წესებს.

მეტი »

ტერმინების სიხშირული მატრიცა

(ინგლ. frequency term-document matrix) ცხრილი, რომელიც აიგება ტექსტის მაინინგის პროცესში და ასახავს სხვადასხვა ტერმინის სიხშირეს (ტერმინის განმეორებათა რაოდენობას) ტექსტურ ერთეულებში (დოკუმენტებში).

მეტი »