Αναζήτηση αυτού του ιστολογίου

Αναζήτηση αυτού του ιστολογίου

Τρίτη 28 Ιανουαρίου 2014

To σύμπαν και ο νόμος του Benford

To 1881 o αστρονόμος και μαθηματικός Simon Newcomb έκανε μια αξιοσημείωτη παρατήρηση σε σχέση με τα λογαριθμικά βιβλία (τότε δεν υπήρχαν υπολογιστές ή αριθμομηχανές και οι τιμές των λογαρίθμων υπολογίζονταν χρησιμοποιώντας τους πίνακες τιμών που ήταν καταγεγραμμένες σε ειδικά βιβλία).
Παρατήρησε ότι οι πρώτες σελίδες τους ήταν περισσότερες φθαρμένες σε σχέση με τις τελευταίες. Το γεγονός αυτό τον οδήγησε στο συμπέρασμα ότι τα σημαντικά ψηφία των αριθμών των διαφόρων φυσικών δεδομένων δεν κατανέμονται ισοπίθανα, αλλά ευνοούνται οι μικρότεροι αριθμοί.

Το 1938 ο Frank Benford συνέχισε αυτή την μελέτη και διατύπωσε έναν νόμο που φέρει το όνομά του.
Όταν έχουμε διάφορα αριθμητικά δεδομένα, ενώ θα περιμέναμε ότι για το πρώτο ψηφίο των αριθμών, όλα τα ψηφία από το 1 έως το 9 να έχουν την ίδια συχνότητα εμφάνισης, παρατηρείται ότι αυτό δεν συμβαίνει. Η πιθανότητα το πρώτο ψηφίο ενός αριθμού από ένα σύνολο δεδομένων να είναι το 1, σύμφωνα με το νόμο του Benford είναι 30,1%, η πιθανότητα να είναι το 2 είναι 17,6 % και καθώς πάμε προς το 9 η πιθανότητα μικραίνει:
Ψηφίο
Πιθανότητα
1
30,1 %
2
17,6 %
3
12,5 %
4
9,7 %
5
7,9 %
6
6,7 %
7
5,8 %
8
5,1 %
9
4,6 %
Η εξίσωση από την οποία προκύπτουν οι παραπάνω τιμές είναι:
P(k) = \log_{10} \left(1+ \frac{1}{k} \right), \,\,\,\, k=1, 2, \cdots ,9
Αυτή είναι η απλούστερη περίπτωση του νόμου Benford. Η γενικότερη μορφή του νόμου αυτού είναι:
P(d_{1}, d_{2}, \cdots d_{k}) = \log_{10} \left[1 + \left( \sum\limits_{i=1}^k d_{i} \times 10^{k-i} \right)^{-1} \right]
όπου k \in N, \,\, d_{1} \in (1, 2, \dots ,9), \,\, d_{k} \in (0,1, \cdots ,9), \,\, k \geq 2
και d_{k}  το k-στο κατά σειρά ψηφίο από αριστερά.
Για παράδειγμα, η πιθανότητα να βρούμε έναν αριθμό του οποίου το πρώτο ψηφίο είναι το 2, το δεύτερο ψηφίο είναι 3 και το τρίτο ψηφίο 5, είναι:
P(d_{1} = 2, d_{2} = 3, d_{3}=5) = log_{10} (1+1/235) = 0.0018
ή 0,18%.
Ο νόμος του Benford δοκιμάστηκε και επαληθεύθηκε σε αριθμητικά δεδομένα που προκύπτουν από διάφορα φυσικά, οικονομικά και κοινωνικά συστήματα, όπως χρόνοι ημιζωής για άλφα και βήτα διασπάσεις, ατομικά φάσματα, τιμές μετοχών, αριθμοί λογαριασμών, πληθυσμοί χωριών και πόλεων, μαθηματικές σταθερές, μήκη ποταμών κ.ά.
Χρησιμοποιείται για τον εντοπισμό φοροφυγάδων, δεδομένου ότι οι επίδοξοι  φοροφυγάδες κατανέμουν τα διάφορα νούμερα με τόσο τυχαίο που αποκλίνουν σημαντικά από την κατανομή Benford.
Επιπλέον, στατιστικολόγοι ανέλυσαν τα οικονομικά στοιχεία από 16 χώρες μεταξύ 1999 και 2009 σε σχέση με τον νόμο του Benford, για να διαπιστώσουν ποιες χώρες είχαν δώσει πλαστά στοιχεία. Τελικά τα στοιχεία έδειξαν ότι το Βέλγιο είχε την μεγαλύτερη απόκλιση (άραγε πως τα πάνε σήμερα οι οικονομίες των κάτω χωρών;) και όχι η Ελλάδα όπως περίμεναν.
Επίσης, μια ενδιαφέρουσα ιδιότητα αυτού του νόμου είναι το αναλλοίωτο ως προς την επιλογή των μονάδων μέτρησης των δεδομένων. Για παράδειγμα όταν ελέγχεται η ισχύς του νόμου σε ένα σύνολο δεδομένων που περιέχονται μήκη, δεν παίζει ρόλο το αν τα μήκη είναι εκφρασμένα σε μέτρα, μίλια ή πόδια.
Ισχύει ο νόμος του Benford σε κοσμολογικά δεδομένα;
Την ισχύ του νόμου του Benford σε δεδομένα κοσμολογικών μετρήσεων έλεγξαν, για πρώτη φορά, οι Θεόδωρος Αλεξόπουλος και Στέφανος Λεοντσίνης, στην εργασία τους με τίτλο «Benford’s Law and the Universe».
Aρχικά μελέτησαν τις αποστάσεις 702 γαλαξιών. Σύμφωνα με την μελέτη αυτή το πρώτο ψηφίο των αριθμών που εκφράζουν τις αποστάσεις των γαλαξιών ακολουθεί ικανοποιητικά την κατανομή Benford, όπως βλέπουμε στο παρακάτω σχήμα:
Benford_galaxies
Στη συνέχεια μελέτησαν την κατανομή του πρώτου, δεύτερου και τρίτου σημαντικού ψηφίου των αριθμών που εκφράζουν τις αποστάσεις 115226 άστρων.  Kαι όπως βλέπουμε στο παρακάτω σχήμα υπάρχει καλή συμφωνία με τον νόμο Benford:benford_starsΠρόκειται για μια πολύ ενδιαφέρουσα σύμπτωση, ακόμα κι αν δεν υπάρχει κάτι βαθύτερο πίσω από αυτή …

Δεν υπάρχουν σχόλια :

Δημοσίευση σχολίου

Φεισμπουκ

Τουιτερ