This post is also available in / Disponible en: : English (Inglés)
Español
Las estadísticas son, como señala el diccionario Merriam-Webster, «una colección de datos cuantitativos». Puro y simple. Lo que no es tan simple es cómo usamos estos datos o cómo les damos sentido.
Afortunadamente, vivimos en una época en la que tenemos a nuestro alcance fuentes increíbles (en cantidad y calidad) de información valiosa, incluyendo todo tipo de estadísticas sobre el béisbol. Podemos verificar qué tan buena es la velocidad de giro (spin rate) de la recta de Justin Verlander (bastante buena) o cómo la efectividad de Matthew Boyd del 2019 es engañosa de acuerdo con estadísticas avanzadas como xFIP y SIERA, por lo que debería estar mejor este año.
Me encanta el spin rate y la SIERA y un montón de otras estadísticas avanzadas así como sé que la información que podemos obtener de ellas supera la mayor parte del tiempo lo que podemos analizar con la velocidad (mph) o la ERA, por nombrar un par de estadísticas tradicionales. Sin embargo, también me gusta tratar de simplificar las cosas pero aún obteniendo ideas poderosas para tomar decisiones informadas.
Nada es más simple que Bolas y Strikes.
Quiero decir, los conocemos tan bien que incluso antes de las zonas de strike virtual omnipresentes que vemos hoy en día, podíamos comenzar a gritarle al árbitro al instante cuando pensamos que estaba cantado mal los lanzamientos. Y lo haremos siempre porque SABEMOS de bolas y strikes. Sabemos que más strikes que bolas siempre serán buenos y los lanzadores que pueden hacer eso suelen tener más éxito.
K% -BB% y (k-bb)/ip (llamémosles las estadísticas K-Bs) son un par de estadísticas que existen solo por las bolas y strikes. Resumen de manera directa el logro que tiene un lanzador sobre los dos resultados principales en los que puede influir más directamente durante una salida: ponches y boletos.
La tasa de ponches (K%) y la tasa de boletos o bases por bolas, (BB%) son cálculos sobre la frecuencia con la que un lanzador poncha o da boleto a los bateadores por aparición al plato (PA). Puede calcularlos dividiendo el número total de ponches o boletos otorgados por un lanzador entre las apariciones en el plato que los bateadores obtuvieron contra él durante un período de tiempo (una semana, mes, temporada, etc.). Luego, con el fin de obtener K% -BB%, simplemente resta y eso es todo.
(k-bb)/ip es similar pero restas primero los ponches menos la base por bolas y luego divides el resultado entre las entradas lanzadas. La razón de esto (y comparativamente dividir entre apariciones al plato para K% -BB%) es obtener proporciones o tasas que nos permitan comparar lanzadores que han enfrentado cantidades muy diferentes de bateadores.
Si está interesado, puede encontrar más información sobre estas estadísticas aquí. Por cierto, Bill James no era fanático de ellas hace unos 10 años, pero Tom Tango sí. Lo que más me intriga acerca de las estadísticas es saber si podrían usarse para anticipar cómo le irá a un lanzador después, su capacidad de predicción, por lo que voy a hacer algunos cálculos para tratar de aclarar eso. Algunas personas han escrito algo sobre esto, pero sus conclusiones no están tan claras para mí, así que investigué por mi cuenta.
Primero, obtuve datos de los lanzadores durante la temporada 2019: el interés principal está en K% – BB% y (k-bb) / ip, por supuesto, y también en ERA y algunos otros estimadores de ERA como xFIP y SIERA. Tenga en cuenta que incluyo además, para comprobar consistencia, otro estimador llamado CSW, que en 2019 ya se demostró que tenía una gran correlación con SIERA y podría ser especialmente útil como estadística de predicción.
Los lanzadores se restringieron a aquellos que tenían al menos 23 o más juegos iniciados, ya que quería abridores con muchas entradas lanzadas para una muestra más grande.
2019 Pitching data.
Name | CSW | (k-bb)/ip | K%-BB% | ERA | FIP | xFIP | SIERA | GS | IP |
---|---|---|---|---|---|---|---|---|---|
Gerrit Cole | 0.3566330 | 1.3107025 | 0.3400000 | 2.50 | 2.64 | 2.48 | 2.62 | 33 | 212.1 |
Chris Sale | 0.3426602 | 1.2304555 | 0.2950000 | 4.40 | 3.39 | 2.93 | 3.00 | 25 | 147.1 |
Max Scherzer | 0.3425993 | 1.2202208 | 0.3030000 | 2.92 | 2.45 | 2.88 | 2.93 | 27 | 172.1 |
Justin Verlander | 0.3401972 | 1.1569507 | 0.3040000 | 2.58 | 3.27 | 3.18 | 2.95 | 34 | 223 |
Jacob deGrom | 0.3060358 | 1.0343137 | 0.2620000 | 2.43 | 2.67 | 3.11 | 3.29 | 32 | 204 |
Shane Bieber | 0.3310324 | 1.0228865 | 0.2550000 | 3.28 | 3.32 | 3.23 | 3.36 | 33 | 214.1 |
Matthew Boyd | 0.3171905 | 1.0156672 | 0.2380000 | 4.56 | 4.32 | 3.88 | 3.61 | 32 | 185.1 |
Blake Snell | 0.3395029 | 1.0000000 | 0.2420000 | 4.29 | 3.32 | 3.31 | 3.56 | 23 | 107 |
Walker Buehler | 0.3143058 | 0.9774849 | 0.2420000 | 3.26 | 3.01 | 3.37 | 3.50 | 30 | 182.1 |
Yu Darvish | 0.3205758 | 0.9708193 | 0.2360000 | 3.98 | 4.18 | 3.39 | 3.55 | 31 | 178.2 |
Lucas Giolito | 0.3262260 | 0.9704881 | 0.2420000 | 3.41 | 3.43 | 3.66 | 3.57 | 29 | 176.2 |
Charlie Morton | 0.3268557 | 0.9423275 | 0.2320000 | 3.05 | 2.81 | 3.28 | 3.54 | 33 | 194.2 |
Stephen Strasburg | 0.3221040 | 0.9330144 | 0.2320000 | 3.32 | 3.25 | 3.17 | 3.49 | 33 | 209 |
Lance Lynn | 0.2907402 | 0.8986064 | 0.2140000 | 3.67 | 3.13 | 3.85 | 3.83 | 33 | 208.1 |
Jack Flaherty | 0.3120478 | 0.8975013 | 0.2280000 | 2.75 | 3.46 | 3.64 | 3.68 | 33 | 196.1 |
James Paxton | 0.2979362 | 0.8721704 | 0.2070000 | 3.82 | 3.86 | 4.03 | 3.93 | 29 | 150.2 |
Chris Paddack | 0.3008772 | 0.8701854 | 0.2140000 | 3.33 | 3.95 | 4.05 | 3.83 | 26 | 140.2 |
Robbie Ray | 0.3208225 | 0.8673176 | 0.2030000 | 4.34 | 4.29 | 3.76 | 4.02 | 33 | 174.1 |
Patrick Corbin | 0.2991816 | 0.8316832 | 0.2010000 | 3.25 | 3.49 | 3.59 | 3.88 | 33 | 202 |
Clayton Kershaw | 0.2990269 | 0.8309938 | 0.2100000 | 3.03 | 3.86 | 3.50 | 3.77 | 28 | 178.1 |
German Marquez | 0.3042813 | 0.8045977 | 0.1940000 | 4.76 | 4.06 | 3.54 | 3.85 | 28 | 174 |
Trevor Bauer | 0.3086520 | 0.8028169 | 0.1880000 | 4.48 | 4.34 | 4.33 | 4.14 | 34 | 213 |
Domingo German | 0.3061860 | 0.7972028 | 0.1920000 | 4.03 | 4.72 | 4.22 | 4.06 | 24 | 143 |
Jake Odorizzi | 0.2809473 | 0.7861635 | 0.1900000 | 3.51 | 3.36 | 4.33 | 4.14 | 30 | 159 |
Sonny Gray | 0.3066346 | 0.7824101 | 0.1940000 | 2.87 | 3.42 | 3.65 | 3.97 | 31 | 175.1 |
Luis Castillo | 0.3100063 | 0.7728707 | 0.1880000 | 3.40 | 3.70 | 3.48 | 3.95 | 32 | 190.2 |
Madison Bumgarner | 0.2872996 | 0.7722008 | 0.1900000 | 3.90 | 3.90 | 4.31 | 4.15 | 34 | 207.2 |
Noah Syndergaard | 0.3040388 | 0.7707911 | 0.1840000 | 4.28 | 3.60 | 3.83 | 4.02 | 32 | 197.2 |
Kenta Maeda | 0.3251130 | 0.7702350 | 0.1890000 | 4.04 | 3.95 | 4.04 | 4.06 | 26 | 153.2 |
Michael Pineda | 0.2848990 | 0.7671233 | 0.1860000 | 4.01 | 4.02 | 4.30 | 4.18 | 26 | 146 |
Hyun-Jin Ryu | 0.2908352 | 0.7628979 | 0.1920000 | 2.32 | 3.10 | 3.32 | 3.77 | 29 | 182.2 |
Max Fried | 0.2940075 | 0.7627119 | 0.1790000 | 4.02 | 3.72 | 3.32 | 3.83 | 30 | 165.2 |
Zack Greinke | 0.2977835 | 0.7540826 | 0.1940000 | 2.93 | 3.22 | 3.74 | 3.96 | 33 | 208.2 |
Zack Wheeler | 0.2792023 | 0.7432086 | 0.1760000 | 3.96 | 3.48 | 4.06 | 4.20 | 31 | 195.1 |
Vince Velasquez | 0.2693396 | 0.7429547 | 0.1690000 | 4.91 | 5.21 | 4.75 | 4.36 | 23 | 117.1 |
Chris Archer | 0.3069590 | 0.7382550 | 0.1670000 | 5.19 | 5.02 | 4.36 | 4.38 | 23 | 119.2 |
Aaron Nola | 0.3232293 | 0.7372588 | 0.1750000 | 3.87 | 4.03 | 3.82 | 4.14 | 34 | 202.1 |
Tyler Mahle | 0.3052917 | 0.7352941 | 0.1710000 | 5.14 | 4.66 | 3.99 | 4.16 | 25 | 129.2 |
Jose Berrios | 0.2975734 | 0.7196402 | 0.1710000 | 3.68 | 3.85 | 4.32 | 4.28 | 32 | 200.1 |
Anthony DeSclafani | 0.2736132 | 0.7099880 | 0.1700000 | 3.89 | 4.43 | 4.30 | 4.29 | 31 | 166.2 |
Caleb Smith | 0.2867343 | 0.7054213 | 0.1670000 | 4.52 | 5.11 | 5.05 | 4.58 | 28 | 153.1 |
Joe Musgrove | 0.2871660 | 0.6937096 | 0.1650000 | 4.44 | 3.82 | 4.31 | 4.31 | 31 | 170.1 |
Eduardo Rodriguez | 0.2886981 | 0.6794682 | 0.1610000 | 3.81 | 3.86 | 4.10 | 4.31 | 34 | 203.1 |
Kyle Hendricks | 0.2972572 | 0.6666667 | 0.1620000 | 3.46 | 3.61 | 4.26 | 4.38 | 30 | 177 |
Jon Lester | 0.2645416 | 0.6600467 | 0.1480000 | 4.46 | 4.26 | 4.35 | 4.49 | 31 | 171.2 |
Chris Bassitt | 0.2769547 | 0.6527778 | 0.1530000 | 3.81 | 4.40 | 4.61 | 4.47 | 25 | 144 |
Kyle Gibson | 0.2850941 | 0.6500000 | 0.1480000 | 4.84 | 4.26 | 3.80 | 4.25 | 29 | 160 |
Ryne Stanek | 0.2961538 | 0.6493506 | 0.1530000 | 3.97 | 4.28 | 4.72 | 4.47 | 27 | 77 |
Tanner Roark | 0.2533422 | 0.6480921 | 0.1480000 | 4.35 | 4.67 | 4.64 | 4.57 | 31 | 165.1 |
Jordan Lyles | 0.2772801 | 0.6453901 | 0.1520000 | 4.15 | 4.64 | 4.61 | 4.53 | 28 | 141 |
Dylan Bundy | 0.2987761 | 0.6451613 | 0.1480000 | 4.79 | 4.73 | 4.58 | 4.54 | 30 | 161.2 |
Mike Minor | 0.2942228 | 0.6343104 | 0.1530000 | 3.59 | 4.25 | 4.60 | 4.51 | 32 | 208.1 |
Steven Matz | 0.2838638 | 0.6308557 | 0.1460000 | 4.21 | 4.60 | 4.33 | 4.47 | 30 | 160.1 |
Jon Gray | 0.2890855 | 0.6266667 | 0.1480000 | 3.84 | 4.06 | 3.89 | 4.35 | 25 | 150 |
Joey Lucchesi | 0.2898222 | 0.6250000 | 0.1480000 | 4.18 | 4.17 | 4.36 | 4.48 | 30 | 163.2 |
Jose Quintana | 0.2738854 | 0.6198830 | 0.1420000 | 4.68 | 3.80 | 4.20 | 4.50 | 31 | 171 |
Cole Hamels | 0.2903091 | 0.6161473 | 0.1410000 | 3.81 | 4.09 | 4.38 | 4.55 | 27 | 141.2 |
Miles Mikolas | 0.2772933 | 0.6086957 | 0.1470000 | 4.16 | 4.27 | 4.18 | 4.39 | 32 | 184 |
Jakob Junis | 0.2822967 | 0.6053684 | 0.1380000 | 5.24 | 4.82 | 4.63 | 4.63 | 31 | 175.1 |
Daniel Norris | 0.2820839 | 0.6037474 | 0.1430000 | 4.49 | 4.61 | 4.55 | 4.57 | 29 | 144.1 |
Masahiro Tanaka | 0.2859706 | 0.5989011 | 0.1430000 | 4.45 | 4.27 | 4.29 | 4.46 | 31 | 182 |
Homer Bailey | 0.2785614 | 0.5885960 | 0.1380000 | 4.57 | 4.11 | 4.43 | 4.60 | 31 | 163.1 |
Spencer Turnbull | 0.2589252 | 0.5874409 | 0.1330000 | 4.61 | 3.99 | 4.63 | 4.62 | 30 | 148.1 |
Eric Lauer | 0.2673307 | 0.5831099 | 0.1340000 | 4.45 | 4.23 | 4.77 | 4.72 | 29 | 149.2 |
Mike Soroka | 0.2768870 | 0.5797933 | 0.1440000 | 2.68 | 3.45 | 3.85 | 4.28 | 29 | 174.2 |
Trent Thornton | 0.2761870 | 0.5710578 | 0.1300000 | 4.84 | 4.59 | 4.94 | 4.80 | 29 | 154.1 |
Reynaldo Lopez | 0.2785330 | 0.5652174 | 0.1290000 | 5.38 | 5.04 | 5.27 | 4.88 | 33 | 184 |
J.A. Happ | 0.2596439 | 0.5648665 | 0.1350000 | 4.91 | 5.22 | 4.78 | 4.72 | 30 | 161.1 |
Rick Porcello | 0.2648649 | 0.5628949 | 0.1270000 | 5.52 | 4.76 | 5.14 | 4.86 | 32 | 174.1 |
Merrill Kelly | 0.2741391 | 0.5516111 | 0.1300000 | 4.42 | 4.51 | 4.58 | 4.73 | 32 | 183.1 |
Marcus Stroman | 0.2779783 | 0.5486149 | 0.1300000 | 3.22 | 3.72 | 3.99 | 4.41 | 32 | 184.1 |
John Means | 0.2513987 | 0.5354839 | 0.1300000 | 3.60 | 4.41 | 5.48 | 5.02 | 27 | 155 |
Jhoulys Chacin | 0.2735219 | 0.5334627 | 0.1170000 | 6.01 | 5.88 | 5.03 | 4.94 | 24 | 103.1 |
Chase Anderson | 0.2658863 | 0.5323741 | 0.1250000 | 4.21 | 4.83 | 5.26 | 4.89 | 27 | 139 |
Danny Duffy | 0.2757982 | 0.5299539 | 0.1240000 | 4.34 | 4.78 | 5.14 | 4.89 | 23 | 130.2 |
Trevor Richards | 0.2786026 | 0.5255366 | 0.1220000 | 4.06 | 4.51 | 5.09 | 4.89 | 23 | 135.1 |
Adam Wainwright | 0.2812935 | 0.5198598 | 0.1190000 | 4.19 | 4.36 | 4.39 | 4.70 | 31 | 171.2 |
Jordan Zimmermann | 0.2765273 | 0.5089286 | 0.1130000 | 6.91 | 4.79 | 4.87 | 4.93 | 23 | 112 |
Mike Leake | 0.2678992 | 0.5076142 | 0.1200000 | 4.29 | 5.19 | 4.76 | 4.79 | 32 | 197 |
Jeff Samardzija | 0.2518297 | 0.5024848 | 0.1230000 | 3.52 | 4.59 | 5.02 | 4.92 | 32 | 181.1 |
Zach Eflin | 0.2746013 | 0.4966278 | 0.1150000 | 4.13 | 4.85 | 4.76 | 4.86 | 28 | 163.1 |
Trevor Williams | 0.2599914 | 0.4752066 | 0.1090000 | 5.38 | 5.12 | 5.25 | 5.08 | 26 | 145.2 |
Wade Miley | 0.2621294 | 0.4727708 | 0.1090000 | 3.98 | 4.51 | 4.52 | 4.80 | 33 | 167.1 |
Anibal Sanchez | 0.2654275 | 0.4578313 | 0.1060000 | 3.85 | 4.44 | 5.10 | 5.07 | 30 | 166 |
Julio Teheran | 0.2674572 | 0.4535017 | 0.1050000 | 3.81 | 4.66 | 5.26 | 5.11 | 33 | 174.2 |
Marco Gonzales | 0.2728960 | 0.4482759 | 0.1050000 | 3.99 | 4.15 | 5.11 | 5.08 | 34 | 203 |
Jake Arrieta | 0.2714416 | 0.4363905 | 0.0990000 | 4.64 | 4.89 | 4.46 | 4.82 | 24 | 135.2 |
Martin Perez | 0.2637085 | 0.4118716 | 0.0920000 | 5.12 | 4.66 | 4.69 | 5.01 | 29 | 165.1 |
Yusei Kikuchi | 0.2583609 | 0.4094293 | 0.0920000 | 5.46 | 5.71 | 5.18 | 5.17 | 32 | 161.2 |
Jason Vargas | 0.2766467 | 0.4088472 | 0.0940000 | 4.51 | 4.76 | 5.44 | 5.25 | 29 | 149.2 |
Mike Fiers | 0.2656088 | 0.3963084 | 0.0970000 | 3.90 | 4.97 | 5.19 | 5.19 | 33 | 184.2 |
Michael Wacha | 0.2460209 | 0.3882726 | 0.0870000 | 4.76 | 5.61 | 4.80 | 5.08 | 24 | 126.2 |
Aaron Sanchez | 0.2672451 | 0.3585050 | 0.0780000 | 5.89 | 5.25 | 5.15 | 5.28 | 27 | 131.1 |
Ivan Nova | 0.2382696 | 0.3582888 | 0.0830000 | 4.72 | 4.98 | 4.91 | 5.16 | 34 | 187 |
Sandy Alcantara | 0.2665804 | 0.3551497 | 0.0830000 | 3.88 | 4.55 | 5.17 | 5.28 | 32 | 197.1 |
Andrew Cashner | 0.2584628 | 0.3333333 | 0.0790000 | 4.68 | 4.66 | 5.11 | 5.20 | 23 | 150 |
Zach Davies | 0.2485075 | 0.3203518 | 0.0760000 | 3.55 | 4.56 | 5.20 | 5.43 | 31 | 159.2 |
Brad Keller | 0.2508300 | 0.3149606 | 0.0730000 | 4.19 | 4.35 | 4.94 | 5.23 | 28 | 165.1 |
Glenn Sparkman | 0.2369231 | 0.2941176 | 0.0660000 | 6.02 | 5.93 | 5.81 | 5.59 | 23 | 136 |
Dakota Hudson | 0.2654494 | 0.2870264 | 0.0660000 | 3.35 | 4.93 | 4.55 | 5.08 | 32 | 174.2 |
Brett Anderson | 0.2459571 | 0.2329545 | 0.0550000 | 3.89 | 4.57 | 4.79 | 5.17 | 31 | 176 |
Antonio Senzatela | 0.2329012 | 0.1529791 | 0.0330000 | 6.71 | 5.44 | 5.12 | 5.50 | 25 | 124.2 |
SIERA es aclamada casi universalmente como uno de los mejores estimadores de ERA e inicialmente quiero verificar cuál es la correlación entre las estadísticas K-Bs y la misma. Primero, creé gráficos para la relación entre ERA, xFIP y SIERA con los K-Bs y tracé la línea de tendencia, su ecuación y R2 para cada uno:


Como se esperaba, debido al impacto de Ks y BBs en su fórmula, SIERA tiene el R2 más alto, lo cual es excelente, ya que indica la varianza más baja y eso lleva a pensar que estas estadísticas más simples pueden usarse con resultados equivalentes a SIERA. Pero si realmente quiero ir un paso más allá, debería comparar las K-Bs 2018 con el SIERA 2019 y verificar la correlación para tratar de descubrir cualquier previsibilidad real.
Al extraer los datos y graficarlos obtenemos:

Al principio, solo podíamos interpretar que, como lo muestran los valores de R2, la concurrencia en SIERA 2019 debido a 2018 (k-bb) / ip o 2018 K% -BB% es 44% y 48% respectivamente y eso podría ser demasiado bajo para ser significativo. Con ese pensamiento, estaríamos en lo correcto y lo incorrecto al mismo tiempo, siendo varianza la palabra clave y factor decisivo aquí.
Como Phil Birnbaum explica gentilmente en esta publicación, la mayoría de las veces R2 dice mucho desde el punto de vista estadístico y su valor es importante, pero, en términos llanos, el coeficiente de correlación R (la raíz cuadrada de R2) es más informativo y útil. R nos dice que la correlación es de alrededor del 66% y 70% para (k-bb)/ip y K%-BB% respectivamente, lo cual es bueno y potencialmente indica que estas estadísticas pueden usarse para predecir el rendimiento de un lanzador.
Hay mucha más verificación de datos que debo hacer, de hecho, usar más temporadas ayudaría ya que la muestra será más grande, pero este pequeño ejercicio demuestra que las K-Bs son buenas herramientas para hacer estimaciones informadas sobre el futuro desempeños de los lanzadores. Puede parecer que he reinventado la rueda, pero te sorprendería cuánto la gente tiende a subestimar estas estadísticas, por lo que cualquier impulso a nuestra confianza en ellas es importante.
Entonces, ¿qué podemos hacer con K%-BB% y (k-bb)/ip que conduzca a información útil y práctica? Bueno, dediqué un artículo a la evaluación de los 50 mejores lanzadores que entrarán en la temporada 2020 de acuerdo con estas estadísticas de 2019 y hay algunas sorpresas que creo que deberías considerar. Alerta de spoiler: deberías intentar conseguir a Matthew Boyd. Y Kevin Gausman podría tener una temporada muy decente.
El béisbol es un juego tan maravilloso que, además de las alegrías de simplemente verlo, nos ha regalado la alegría de medirlo y analizarlo hasta el infinito. Puede ser, y es, medido más allá del ridículo, lo que puede ser una bendición o una maldición ya que separar las agujas del heno parece muchas veces complicado. Pero no tiene que ser así; lo bueno de tener tanta información disponible es que, si podemos entenderlas, las diversas formas de ver nuestro querido juego aumentan nuestra apreciación: si el conocimiento es poder, el conocimiento aplicado es sabiduría. Intentemos ser sabios o morir en el intento.
Toda la data usada fue tomada de https://www.fangraphs.com/, https://baseballsavant.mlb.com/ y/o https://www.baseball-reference.com/, a menos que se diga algo distinto.

EE, Data geek, Baseball fan. Twitter: @camarcano