Διευκρινίσεις σχετικά με τις διαφορές των πηγών των στατιστικών Ευρωλίγκας και Ελληνικού Πρωταθλήματος και αναφορά σε πρόσφατες προσθήκες.
Σε αυτή την ανάρτηση θα καταπιαστώ με θέματα που αφορούν τις βάσεις στατιστικών που παρουσιάζω στο Badbasket.gr για την Ευρωλίγκα και το Ελληνικό Πρωτάθλημα και χρήζουν διευκρίνισης, αλλά και με άλλα θέματα και προσθήκες που αφορούν τα boxscore στατιστικά.
Καταγραφή λεπτών συμμετοχής
Αν και το τυπολόγιο το οποίο χρησιμοποιείται για τον υπολογισμο των μη βασικών στατιστικών στις βάσεις αυτές αλλά και σε αυτή των προηγούμενων περιόδων του Eurocup είναι ίδιο, οι πηγές των βασικών στατιστικών διαφέρουν, δημιουργώντας μικρές διαφορές στην ακρίβεια των αποτελεσμάτων.
Στις σελίδες των συγκεντρωτικών στατιστικών της Euroleague και του Eurocup παρουσιάζονται τα συνολικά λεπτά συμμετοχής των παικτών τα οποία καταγράφονται στη βάση μέχρι τα δεκάκις χιλιοστά.
Για παράδειγμα, τα 336:41 λεπτά συμμετοχής του Matt Lojeski στην παραπάνω εικόνα, καταχωρούνται ως 336,6833. Αυτό επιτρέπει την στρογγυλοποίηση των συνολικών λεπτών των παικτών μιας ομάδας στις περισσότερες περιπτώσεις, εκτός αν ο χρόνος συμμετοχής αρκετών παικτών μετατρέπεται σε αριθμούς που καταλήγουν σε δέκατα ή εκατοστά. Στην βάση στατιστικών του Ελληνικού Πρωταθλήματος η παρουσιάση είναι διαφορετική.
Στους πίνακες που χρησιμοποιώ ως πηγή και που βρίσκονται στη σελίδα του ΕΣΑΚΕ παρουσιάζονται οι μέσοι όροι λεπτών συμμετοχής των παικτών. Στη περίπτωση λοιπόν του Γιώργου Παπαγιάννη τα 10:58 λεπτά μέσου όρου συμμετοχής μετατρέπονται σε 10,9667 και στη συνέχεια πολλαπλασιάζονται επι τους αγώνες του παίκτη για να μας δώσουν τα 186,4339 συνολικά λεπτά συμμετοχής του μέχρι την 20η αγωνιστική.
Συγκρίνοντας τα συνολικά λεπτά παικτών-ομάδων, με τα συνολικά λεπτά συμμετοχης στον πίνακα των παικτών τα σύνολα είναι 90000 - 89999,9991 για την Ευρωλίγκα (249 παίκτες) μέχρι την 28η αγωνιστική και 56000 - 55994,103 για το Ελληνικό Πρωτάθλημα (231 παίκτες) μέχρι την 20η αγωνιστική.
Στη βάση του Ελληνικού Πρωταθλήματος υπάρχει σταθερά μεγαλύτερη διαφορά, που έστω και σε μικρό βαθμό επηρεάζει την ακρίβεια των αποτελεσμάτων των προηγμένων στατιστικών που χρησιμοποιούν τη σύγκριση του χρόνου συμμετοχής ενός παίκτη με τα συνολικά λεπτά παικτών της ομάδας του. Τέτοια στατιστικά είναι τα ποσοστιαία (πχ ORB%, AST%), τα ατομικά ratings (Ortg-Drtg) και οι Win Shares.
Ομαδικά στατιστικά
Μια άλλη διαφορά που επηρεάζει τα αποτελέσματα των υπολογισμών αρκετών προηγμένων στατιστικών του Ελληνικού Πρωταθλήματος είναι η μη καταχώρηση των ομαδικών στατιστικών στα συνολικά στατιστικά των ομάδων. Ας πάρουμε για παράδειγμα τους πίνακες στατιστικών του πρόσφατου αγώνα Παναθηναϊκός - Κολοσσός. Σε αυτό τον αγώνα ο Παναθηναϊκός δημιούργησε νέο ομαδικό ρεκόρ συνολικών ριμπάουντ με 63, όπως φαίνεται και στα boxscores που φιλοξενούνται στη σελίδα widgets.baskethotel.com.
Από αυτά τα 63 ριμπάουντ τα 3 ήταν ομαδικά. Αυτά τα 3 ομαδικά ριμπάουντ, δεν μεταφέρονται στους πίνακες αγώνων που φιλοξενούνται στη σελίδα του ΕΣΑΚΕ και κατα συνέπεια ούτε και στους πίνακες συγκεντρωτικών στατιστικών της σελίδας. Τα σύνολα, λοιπόν, που παρουσιάζονται τόσο στην επίσημη σελίδα της διοργάνωσης όσο και στους πίνακες μου σε Excel και Tableau, αφορούν το σύνολο των (60) ριμπάουντ τα οποία έχουν ανακτήσει συγκεκριμένοι παίκτες. Αντίθετα, στους πίνακες της Euroleague, στα σύνολα των ριμπάουντ κάθε ομάδας περιέχονται και τα ομαδικά ριμπάουντ.
Βλέποντας τον πίνακα του Παναθηναϊκού, το σύνολο των ριμπάουντ των παικτών είναι 825. Το σύνολο των ριμπάουντ της ομάδας είναι 928. Η διαφορά των 103 ριμπάουντ είναι τα ομαδικά ριμπάουντ, αυτά δηλαδή που κέρδισε μια ομάδα αλλά δεν έχουν αποδοθεί σε συγκεκριμένο παίκτη. Παρόμοια διαφορά υπάρχει και στη στήλη των λαθών, όπου 6 από τα 312 λάθη του Παναθηναϊκού δεν έχουν αποδοθεί σε συγκεκριμένο παίκτη.
Για να δούμε την επιρροή αυτων των διαφορών στα στατιστικά του Ελληνικού Πρωταθλήματος ας ρίξουμε μια ματιά στον τύπο υπολογισμού των ομαδικών κατοχών:
Από αυτά τα 63 ριμπάουντ τα 3 ήταν ομαδικά. Αυτά τα 3 ομαδικά ριμπάουντ, δεν μεταφέρονται στους πίνακες αγώνων που φιλοξενούνται στη σελίδα του ΕΣΑΚΕ και κατα συνέπεια ούτε και στους πίνακες συγκεντρωτικών στατιστικών της σελίδας. Τα σύνολα, λοιπόν, που παρουσιάζονται τόσο στην επίσημη σελίδα της διοργάνωσης όσο και στους πίνακες μου σε Excel και Tableau, αφορούν το σύνολο των (60) ριμπάουντ τα οποία έχουν ανακτήσει συγκεκριμένοι παίκτες. Αντίθετα, στους πίνακες της Euroleague, στα σύνολα των ριμπάουντ κάθε ομάδας περιέχονται και τα ομαδικά ριμπάουντ.
Βλέποντας τον πίνακα του Παναθηναϊκού, το σύνολο των ριμπάουντ των παικτών είναι 825. Το σύνολο των ριμπάουντ της ομάδας είναι 928. Η διαφορά των 103 ριμπάουντ είναι τα ομαδικά ριμπάουντ, αυτά δηλαδή που κέρδισε μια ομάδα αλλά δεν έχουν αποδοθεί σε συγκεκριμένο παίκτη. Παρόμοια διαφορά υπάρχει και στη στήλη των λαθών, όπου 6 από τα 312 λάθη του Παναθηναϊκού δεν έχουν αποδοθεί σε συγκεκριμένο παίκτη.
Για να δούμε την επιρροή αυτων των διαφορών στα στατιστικά του Ελληνικού Πρωταθλήματος ας ρίξουμε μια ματιά στον τύπο υπολογισμού των ομαδικών κατοχών:
Ο λόγος "Επιθετικα ριμπάουντ προς Διαθέσιμα επιθετικά ριμπάουντ" πολλαπλασιάζεται με τον αριθμό των χαμένων σουτ. Το αποτέλεσμα αυτου του υπολογισμού αφαιρείται από τις κατοχές, τόσο της ομάδας όσο και του αντιπάλου, αφού όμως πρώτα πολλαπλασιαστεί επί 1,07.
Αυτή η κατά 7% αύξηση στο αφαιρεμένο αποτέλεσμα αφορά τα ομαδικά επιθετικά ριμπάουντ και εμφανίζεται και σε άλλους υπολογισμούς, όπως αυτόν των κατοχών από άστοχα σουτ (στα ατομικά Ortg), των υπολογισμών των αναχαιτισμένων κατοχών (στα ατομικά Drtg) αλλά και μέσω των κατοχών αντιπάλου στον υπολογισμό του ποσοστού κλεψιμάτων (STL%). Αυτή όμως η επιπλέον αφαίρεση στα στατιστικά του Ελληνικού Πρωταθλήματος, γίνεται χωρίς να περιέχονται αυτά τα επιπλέον στατιστικά στα σύνολα (προς το παρόν τουλάχιστον).
Αυτή η κατά 7% αύξηση στο αφαιρεμένο αποτέλεσμα αφορά τα ομαδικά επιθετικά ριμπάουντ και εμφανίζεται και σε άλλους υπολογισμούς, όπως αυτόν των κατοχών από άστοχα σουτ (στα ατομικά Ortg), των υπολογισμών των αναχαιτισμένων κατοχών (στα ατομικά Drtg) αλλά και μέσω των κατοχών αντιπάλου στον υπολογισμό του ποσοστού κλεψιμάτων (STL%). Αυτή όμως η επιπλέον αφαίρεση στα στατιστικά του Ελληνικού Πρωταθλήματος, γίνεται χωρίς να περιέχονται αυτά τα επιπλέον στατιστικά στα σύνολα (προς το παρόν τουλάχιστον).
Τι είναι τελικά αυτό το Assist Percentage (AST%)
Τα τελευταία δύο και κάτι χρόνια στα οποία παρουσιάζω τα στατιστικά στο Badbasket.gr και παρακολουθώ προσπάθειες δημοσιογράφων και μη που ασχολούνται με διάφορες διαθέσιμες βάσεις, το AST% αναφέρεται αρκετές φορές σε ελεύθερη μετάφραση ως "ποσοστό ασίστ". Αυτή όμως η περιγραφή παραπέμπει σε ένα λόγο "Ασίστ προς Συνολικές ασίστ ομάδας" κάτι το οποίο δεν ισχύει. Ας δούμε την περιγραφή στο τυπολόγιο και τον τύπο:
Όπως βλέπουμε στην περιγραφή το AST% εκτιμά:
- Στο διάστημα που ένας παίκτης βρίσκεται στο παρκέ
- Το ποσοστό του συνόλου των εύστοχων σουτ της ομάδας σε αυτό το διάστημα
- Στο οποίο ο παίκτης έδωσε την ασίστ
Από τη σεζόν 2010-11 αυτό το ποσοστό έχει αλλοιωθεί, αφού καμία από τις δύο διοργανώσεις δεν έχει ξεχωρίσει στη βάση της τις ασίστ ελευθέρων βολών από αυτές που προκύπτουν από εύστοχα σουτ.
Ας πάρουμε για παράδειγμα τον Νικ Καλάθη της σεζόν 2016-17. Οι συνολικές του ασίστ ήταν 183 με 16 από αυτές να αντιστοιχούν σε εύστοχες βολές (η καταγραφή έγινε στο χέρι από μένα). Αν βάλουμε στον τύπο το σύνολο των ασίστ του Νικ το αποτέλεσμα είναι 38,7 AST%. Αν βάλουμε στον τύπο τις ασίστ που έχουν προκύψει από εύστοχα σουτ (167) αυτό το ποσοστό πέφτει σε 35.3 AST%.
Όπως βλέπουμε στην περιγραφή το AST% εκτιμά:
- Στο διάστημα που ένας παίκτης βρίσκεται στο παρκέ
- Το ποσοστό του συνόλου των εύστοχων σουτ της ομάδας σε αυτό το διάστημα
- Στο οποίο ο παίκτης έδωσε την ασίστ
Από τη σεζόν 2010-11 αυτό το ποσοστό έχει αλλοιωθεί, αφού καμία από τις δύο διοργανώσεις δεν έχει ξεχωρίσει στη βάση της τις ασίστ ελευθέρων βολών από αυτές που προκύπτουν από εύστοχα σουτ.
Ας πάρουμε για παράδειγμα τον Νικ Καλάθη της σεζόν 2016-17. Οι συνολικές του ασίστ ήταν 183 με 16 από αυτές να αντιστοιχούν σε εύστοχες βολές (η καταγραφή έγινε στο χέρι από μένα). Αν βάλουμε στον τύπο το σύνολο των ασίστ του Νικ το αποτέλεσμα είναι 38,7 AST%. Αν βάλουμε στον τύπο τις ασίστ που έχουν προκύψει από εύστοχα σουτ (167) αυτό το ποσοστό πέφτει σε 35.3 AST%.
Τα προηγμένα στατιστικά στα αρχεία box scores
Η τελευταία προσθήκη που έγινε στις βάσεις στατιστικών της Euroleague και του Ελληνικού Πρωταθλήματος είναι η παρουσίαση των box scores της φετινής σεζόν. Σε αυτά παρουσιάζονται τα βασικά στατιστικά και όσα προηγμένα στατιστικά μπορούν να εξαχθούν από αυτά.
Οι δύο καρτέλες που ακολουθούν περιέχουν μαζεμένα τα ανά αγώνα στατιστικά όλων των παικτών και στις τελευταίες τρείς καρτέλες υπάρχει η δυνατότητα επιλογής των συνολικών στατιστικών, των μέσων όρων και των προηγμένων στατιστικών των παικτών σε ένα ορισμένο διάστημα της σεζόν.
Ένα παράδειγμα παρουσιάζεται στις εικόνες που ακολουθούν, με τους μέσους όρους και τα προηγμένα στατιστικά των παικτών του Ολυμπιακού, στους τελευταίους πέντε αγώνες της Euroleague, στους οποίους ο Janis Strelnieks απουσιάζει.
Οι πίνακες αυτοί δίνουν τη δυνατότητα παρακολούθησης των στατιστικών των παικτών μιας ομάδας σε σύντομο χρονικό διάστημα μετά τους αγώνες, κάτι που μέχρι τώρα συνέβαινε μετά το τέλος κάθε αγωνιστικής, όταν ανανεωνόταν το αρχείο συγκεντρωτικών στατιστικών σε excel και tableau.
Η μόνη διευκρίνιση έχει να κάνει πάλι με τα προηγμένα στατιστικά. Τα αρχεία των box scores παρουσιάζουν τα στατιστικά αυτά λαμβάνοντας υπόψη τα ομαδικά στατιστικά μόνο στους αγώνες στους οποίους αγωνίστηκε ο κάθε παίκτης. Συνεπώς τα αποτελέσματα δεν πρέπει να είναι ίσα με αυτά των συγκεντρωτικών πινάκων, ενώ είναι πιο συγκεκριμένα από αυτά.
Προσθήκες σε άλλους πίνακες
Εκτός των παραπάνω, έγιναν κάποιες μεμονωμένες προσθήκες και σε ήδη υπάρχοντα αρχεία. Στις παρουσιάσεις στατιστικών των παικτών της Ευρωλίγκας τόσο ανά σεζόν όσο και σε επίπεδο καριέρας προστέθηκε στη καρτέλα SHOOTING ακόμη μια στήλη με πόντους ανά σουτ.
Σε τι διαφέρει η καινούργια στήλη (PPSh) με την παλιά (PPS); Οι PPS παρουσιάζουν το αποτέλεσμα του λόγου "Συνολικοί πόντοι ανά προσπάθεια για σουτ" (PTS/FGA) το οποίο περιέχει και τους πόντους από ελεύθερες βολές. Οι PPSh ασχολούνται μόνο με τους πόντους που προήλθαν από εύστοχα σουτ ((2*2FG+3*3FG)/FGA). Οι PPSh είναι αυτοί που παρουσιάζονται και στα shot charts του Παναγιώτη (@lostgps) στο Basketball Guru:
Οι PPSh έχουν προστεθεί επίσης στο αρχείο σύγκρισης παικτών και συγκεκριμένα στα ADVANCED STATS. Επίσης, στη κατηγορία MISCELLANEOUS του ίδιου αρχείου προστέθηκε το Stop% των παικτών:
Ότι σας προβληματίζει σχετικά με τα παραπάνω ή οτιδήποτε άλλο αφορά τις βάσεις στατιστικών μπορούμε να το συζητήσουμε είτε στο facebook είτε στο twitter.
Ανδρεάς Χριστοφόρου
Ανδρεάς Χριστοφόρου
COMMENTS