ბენფორდის კანონი და არჩევნების შედეგები
ფოტო: On.ge
როგორ დავადგინოთ მანიპულაცია ციფრების სიხშირის დათვლით
ფიდბექის საფუძველზე სტატია რამდენჯერმე გადამუშავდა.
სტატიის პირველი ნაწილი პოპულარულ ენაზე მოყოლილ ფაქტებსა და ინფორმაციას შეიცავს. მეორე ნაწილში მოყვანილია დასაბუთებული სტატისტიკური ანალიზი.
ციფრები და რიცხვები
საყოფაცხოვრებო მეტყველებაში ხშირად ვურევთ ხოლმე ერთმანეთში სიტყვებს "ციფრი" და "რიცხვი". რიცხვები უსასრულოა, ციფრი კი, სულ 10 ცალი გვაქვს და ამ ფაქტს ჩვენს ანატომიას და არაბებს უნდა ვუმადლოდეთ, რომლებმაც ათობითი სისტემა მოიგონეს.
რიცხვი ბუნებრივ სიდიდეს აღწერს. მისი ციფრული ჩანაწერი კი, როგორც მაგალითად, "1825", ადამიანის მიერ გამოგონილი რამ გახლავთ.
ციფრების სიხშირე
ნებისმიერი სიდიდე რომ გავზომოთ, იგი ციფრების სახით უნდა ჩავწეროთ და მაგალითად, ბოლო ციფრის სიხშირეს (მისი ამოსვლის ალბათობას) დავაკვირდეთ. ვნახავთ, რომ ერთნაირად ხშირად გვხვდება ციფრი 1-ც, 9-ც და 5-იც. ბოლო ციფრის ალბათობა მართლაც ერთი მეათედია, პირველი ციფრის ალბათობა კი ე.წ. ბენფორდის კანონს ემორჩილება.
დიდად არ ჩავუღრმავდები, მაგრამ ბენფორდის კანონი ხშირად გამოიყენება სხვადასხვაგვარი მანიპულაციის დასადგენად. მაგალითად, ადრე ქვითრებზე გადაკეთებული თანხებისა და ნომრების დასადგენად გამოიყენებოდა. ბოლო დროს, ბევრს საუბრობენ ამერიკაში ჩატარებული არჩევნების შედეგების ბენფორდის კანონთან თანხვედრა/აცდენაზე.
აბა, ჩვენთან რა ხდება?
ავიღე ჩვენი მონაცემები უბნების მიხედვით, და დავთვალე N41-სთვის მიცემული ხმების რაოდენობების პირველი ციფრების სიხშირეები.
მეგონა ბენფორდიდან ოდნავ წაძვრებს მივიღებდი, რაც მანიპულაციაზე გარკვეული მინიშნება იქნებოდა მეთქი.
შედეგმა ძალიან გამაოგნა!
1-იანის ალბათობა მოსალოდნელზე მთელი 10%-ით დაბალია, მაშინ როდესაც 2-იანის ალბათობა 15%-ით მეტია მოსალოდნელზე.
ასეთი მასიური გადახრა (10–15%), განსაკუთრებით რიცხვ 1-ში, რომელიც ყველაზე ადვილად გადაკეთებადია, ციფრების გადაჯღაბნის შესახებ ეჭვს ბადებს.
ბენფორდის კანონი ყოველთვის არ მუშაობს
პოსტის გამოქვეყნების შემდეგ ბევრმა გამოთქვა შემდეგი ლეგიტიმური მოსაზრება:
სავარაუდოდ, გარკვეული ზომის უბნები უფრო ხშირია, ვიდრე სხვა ზომის უბნები, ამიტომ მაგალითად, თუ უბანზე დაახლოებით 400 ამომრჩეველი გამოცხადდა და 48%-მა "ოცნებას" მისცა ხმა, ეს ორას-რაღაცა ხმა გამოდის და სავარაუდოდ, 2-იანების ჭარბობის მიზეზი ეგ შეიძლება იყოსო. 1-იანების სიმცირეც მსგავსად შეიძლება აიხსნას.
მეც თავში დამიჯდა ეს აზრი და უბნის ზომასა და პირველ ადგილზე დამჯდარ პირველ ციფრს შორის კავშირის დასადგენად დეტალური სტატისტიკური ანალიზი ჩავატარე.
უბნები სხვადასხვა ზომისაა, რამდენიმე ადამიანიდან 1 080 ამომრჩევლამდე. დაახლოებით ერთნაირი ზომის უბნები შეგვიძლია დავაჯგუფოთ და დავთვალოთ, თითოეული ჯგუფისთვის რამდენი შედეგი (ანუ 41-სთვის მიცემული ხმების რაოდენობა) იწყება ციფრი 1-ით. ამას ვუწოდოთ 1-იანის სიხშირის განაწილება უბნის ზომის მიხედვით.
სვეტის x კოორდინატი უბნის ზომას გვიჩვენებს. სვეტის სიმაღლე იმ უბნების რაოდენობას, სადაც პირველ ადგილზე 1-იანი დაჯდა.
სვეტების სიმაღლე მზარდ უბნის ზომასთან ერთად იკლებს, რაც ბუნებრივია. ვთქვათ, უბანზე 416 ამომრჩეველია და 48%-მა მისცა ხმა 41 ნომერს. ამ შემთხვევაში, მიცემული ხმების რაოდენობა იქნება 199 და ეს უბანი ამ სვეტში მოხვდება. ერთი კაცით მეტმაც რომ მისცეს ხმა, ხმების რაოდენობა უკვე 200 გახდება და ეს უბანი ამ გრაფიკზე აღარ მოხვდება.
ცხადია ქართულ ოცნებას ყველა უბანზე ზუსტად 48% არ მიუღია. ყველაფერი იყო — თითქმის 0%-იდან, თითქმის 100%-მდე, მაგრამ უმრავლეს უბნებში ხმების რაოდენობა 48%-ის გარშემო ტრიალებდა.
ახლა ვაკეთებთ ამ განაწილების ე.წ. gaussian fit-ს და ვახდენთ მოსალოდნელი შედეგების სიმულაციას ამ განაწილებით. ამ სიმულაციაშიც ოცნება ზუსტად იგივე შედეგზე გავიდოდა, ოღონდ რომელ უბანში რა რიცხვი დაჯდებოდა, უკვე ცესკოს თანამშრომელი კი არ წერს, არამედ ბუნებრივი განაწილება განსაზღვრავს.
ახლა ისევ პირველ ციფრს დავუბრუნდეთ და ვნახოთ, როგორი იქნებოდა 1,2,3,4 და ა.შ., 9-მდე ციფრების განაწილება უბნების ზომების მიხედვით (მწვანე), ანუ ის ციფრების განაწილება რაც წესით უნდა დამჯდარიყო უბნის ზომის გათვალისწინებით! მერე შევადაროთ ცესკოს არსებულ რეალობას (ლურჯი).
ციფრების სიხშირეები — უბნის ზომის გათვალისწინებით:
აცდენები გრაფიკულადაც ჩანს. მაგალითად, დაჯდა ბევრად მეტი 2-ები, ვიდრე ამას ბუნებრივი განაწილება მოგვცემდა.
აცდენები არამარტო გრაფიკულად, არამედ რიცხვებითაც არის დადასტურებული (იხ. კოდი) Kolmogorov–Smirnov ტესტის საშუალებით.
კიდევ მეტი სკეპტიკოსებისთვის
კრიტიკოსები იტყვიან, რომ ჩვენი თანაბარი განაწილება შეიძლება არ ემთხვეოდეს რეალობას. მაგალითად, შეიძლება რეგიონებში, სადაც პატარა უბნებია, 41-ს უფრო მეტმა მოქალაქემ მისცა ხმა.
მართლაც, ტერიტორიული და უბნების ზომების ჭრილში რომ ვნახოთ მიცემული ხმების პროცენტული რაოდენობა, არაჰომოგენურ სურათს დავინახავთ. იხილეთ წითელი ისრებით აღნიშნული ლაქები. მაგრამ ამ ეფექტის თავიდან ასაცილებლად, შეგვიძლია ამოვჭრათ ჰომოგენური ქვესიმრავლე და მასში მხოლოდ 1-ებისა და 2-ების განაწილებას დავაკვირდეთ. (ამ გრაფიკზე x ღერძი ტერიტორიულ განაწილებას შეესაბამება.)
1-ები და 2-ები ჰომოგენურ ქვესიმრავლეში
ეს ქვესიმრავლე ჰომოგენურია, ანუ არანაირი კორელაცია უბნის ზომასა და ამომრჩევლის პარტიულ გემოვნებას შორის არ შეიმჩნევა. ანუ ალბათობა, 416-კაციან უბანში პირველ ციფრად 2-იანი დაჯდება თუ 1-იანი, ერთნაირია. დავაკვირდეთ 1-იანების და 2-იანების სიმულირებულ და არსებულ განაწილებას მხოლოდ ამ სიმრავლეში.
ირკვევა, რომ მხოლოდ ამ სიმრავლეში, თითქოს უხილავი ხელი ჩაერიაო, დაჯდა იმაზე ნაკლები 1-იანით დაწყებული შედეგი და მეტი 2-იანით დაწყებული, ვიდრე მოსალოდნელი იყო. მრუდები როგორაა წაძრული 1-იანისა მარცხნივ და ორიანისა კიდევ მარჯვნივ, თვითონაც შეამჩნევდით. მარტო ამ ქვესიმრავლეში, ამ "ანომალიით" გამოწვეულმა განსხვავებამ 124 ათასი ხმა შეადგინა, რაც ჯამურ შედეგს 3.2%-ით შეცვლიდა.
-
საქართველოს ბანკის გიორგი ჩახავას სახელობის სასტიპენდიო პროგრამაზე განაცხადი 500-ზე მეტმა სტუდენტმა შეავსო საქართველოს ბანკის გიორგი ჩახავას სახელობის სასტიპენდიო პროგრამაზე განაცხადი 500-ზე მეტმა სტუდენტმა შეავსო
- ბრიტანეთის საგარეო ოფისი: "მოვუწოდებთ საქართველოს მთავრობას გაასაჯაროოს თავიანთი გამოძიების შედეგები BBC-ის სტატიასთან დაკავშირებით" ბრიტანეთის საგარეო ოფისი: "მოვუწოდებთ საქართველოს მთავრობას გაასაჯაროოს თავიანთი გამოძიების შედეგები BBC-ის სტატიასთან დაკავშირებით"
-
დონალდ ტრამპი მწვანე ბარათის ლატარიას აჩერებს დონალდ ტრამპი მწვანე ბარათის ლატარიას აჩერებს
გადახედვა
-
დააკლიკე, იასპარეზე, მოიგე ₾50 000 — დეკემბრის მარათონი თიბისის მობაილბანკში დააკლიკე, იასპარეზე, მოიგე ₾50 000 — დეკემბრის მარათონი თიბისის მობაილბანკში
-
შალვა პაპუაშვილი: EU-მ, როგორც მეურვისგან მიტოვებულმა არასრულწლოვანმა, რატომღაც ჩათვალა, რომ უნდა იკაცოს და თავად გახდეს მსოფლიო პოლიციელი შალვა პაპუაშვილი: EU-მ, როგორც მეურვისგან მიტოვებულმა არასრულწლოვანმა, რატომღაც ჩათვალა, რომ უნდა იკაცოს და თავად გახდეს მსოფლიო პოლიციელი
გადახედვა
-
მოემზადეთ ახალი წლისთვის — PSP-ში საახალწლო შეთავაზებები დაიწყო! მოემზადეთ ახალი წლისთვის — PSP-ში საახალწლო შეთავაზებები დაიწყო!
-
შალვა პაპუაშვილი: უკვე დანამდვილებით შეიძლება თქვა, რომ უკრაინის ომს ნამდვილად ჰყავს ორი დამარცხებული — უკრაინა და ევროკავშირი შალვა პაპუაშვილი: უკვე დანამდვილებით შეიძლება თქვა, რომ უკრაინის ომს ნამდვილად ჰყავს ორი დამარცხებული — უკრაინა და ევროკავშირი
გადახედვა
-
აშშ-მა სისხლის სამართლის საერთაშორისო სასამართლოს ქართველი მოსამართლე გოჩა ლორთქიფანიძე დაასანქცირა აშშ-მა სისხლის სამართლის საერთაშორისო სასამართლოს ქართველი მოსამართლე გოჩა ლორთქიფანიძე დაასანქცირა
გადახედვა
-
გახსენი 20-21 დეკემბრის შეთავაზებები თიბისის საახალწლო კალენდარზე გახსენი 20-21 დეკემბრის შეთავაზებები თიბისის საახალწლო კალენდარზე
-
გაეცანით საქართველოს ბანკისა და QuickShipper-ის შეთავაზებას მცირე და საშუალო ბიზნესისთვის გაეცანით საქართველოს ბანკისა და QuickShipper-ის შეთავაზებას მცირე და საშუალო ბიზნესისთვის
-
ფაშინიანი საქართველოს აფრთხილებს, "ნორმალური ტარიფები თუ არ ექნებათ, სხვა მარშრუტებს იპოვიან" ფაშინიანი საქართველოს აფრთხილებს, "ნორმალური ტარიფები თუ არ ექნებათ, სხვა მარშრუტებს იპოვიან"
გადახედვა
-
შესაფუთი მასალების უსაფრთხოება — რომელი მასალაა ყველაზე უსაფრთხო შესაფუთი მასალების უსაფრთხოება — რომელი მასალაა ყველაზე უსაფრთხო
-
მეთიუ პერის მკვლელობისთვის ბრალი კიდევ ერთ ექიმს დაუდგინეს მეთიუ პერის მკვლელობისთვის ბრალი კიდევ ერთ ექიმს დაუდგინეს
გადახედვა
-
რა არის ცნობიერება და როგორ ვითარდება ის ცოცხალ ორგანიზმებში რა არის ცნობიერება და როგორ ვითარდება ის ცოცხალ ორგანიზმებში
გადახედვა
-
Facebook-ზე ბმულების გაზიარება შეიძლება ფასიანი გახდეს? — ვის ეხება პოტენციური შეზღუდვა Facebook-ზე ბმულების გაზიარება შეიძლება ფასიანი გახდეს? — ვის ეხება პოტენციური შეზღუდვა
გადახედვა
-
FDA-მ დეპრესიის სამკურნალოდ პირველი სახლში გამოსაყენებელი მოწყობილობა დაამტკიცა FDA-მ დეპრესიის სამკურნალოდ პირველი სახლში გამოსაყენებელი მოწყობილობა დაამტკიცა
გადახედვა
-
შეადარე, სცადე, დაიმტკიცე — თიბისიმ ახალი კამპანია დაიწყო შეადარე, სცადე, დაიმტკიცე — თიბისიმ ახალი კამპანია დაიწყო
-
დიდმა ბრიტანეთმა სანქციები დაუწესა "რუსსნეფტს", რომელიც ყულევის ნავთობგადამამუშავებელ ქარხანას ამარაგებს დიდმა ბრიტანეთმა სანქციები დაუწესა "რუსსნეფტს", რომელიც ყულევის ნავთობგადამამუშავებელ ქარხანას ამარაგებს
გადახედვა
-
NASA-მ შემდეგი თაობის ტელესკოპის აწყობა დაასრულა — მას არამიწიერი სიცოცხლის აღმოჩენა შეუძლია NASA-მ შემდეგი თაობის ტელესკოპის აწყობა დაასრულა — მას არამიწიერი სიცოცხლის აღმოჩენა შეუძლია
გადახედვა
-
როგორ იქმნება Spotlight: ახალი იდეებისა და აღმოჩენების სივრცე — ღონისძიების წარმდგენია საქართველოს ბანკი როგორ იქმნება Spotlight: ახალი იდეებისა და აღმოჩენების სივრცე — ღონისძიების წარმდგენია საქართველოს ბანკი
-
საქართველო უღარიბესი ქვეყნებისთვის $10,000-ს გამოყოფს საქართველო უღარიბესი ქვეყნებისთვის $10,000-ს გამოყოფს
გადახედვა

კომენტარები