Reexaminando Ponches y Boletos.

This post is also available in / Disponible en: : enEnglish (Inglés)esEspañol


Las estadísticas son, como señala el diccionario Merriam-Webster, «una colección de datos cuantitativos». Puro y simple. Lo que no es tan simple es cómo usamos estos datos o cómo les damos sentido.

Afortunadamente, vivimos en una época en la que tenemos a nuestro alcance fuentes increíbles (en cantidad y calidad) de información valiosa, incluyendo todo tipo de estadísticas sobre el béisbol. Podemos verificar qué tan buena es la velocidad de giro (spin rate) de la recta de Justin Verlander (bastante buena) o cómo la efectividad de Matthew Boyd del 2019 es engañosa de acuerdo con estadísticas avanzadas como xFIP y SIERA, por lo que debería estar mejor este año.

Me encanta el spin rate y la SIERA y un montón de otras estadísticas avanzadas así como sé que la información que podemos obtener de ellas supera la mayor parte del tiempo lo que podemos analizar con la velocidad (mph) o la ERA, por nombrar un par de estadísticas tradicionales. Sin embargo, también me gusta tratar de simplificar las cosas pero aún obteniendo ideas poderosas para tomar decisiones informadas.

Nada es más simple que Bolas y Strikes.

Quiero decir, los conocemos tan bien que incluso antes de las zonas de strike virtual omnipresentes que vemos hoy en día, podíamos comenzar a gritarle al árbitro al instante cuando pensamos que estaba cantado mal los lanzamientos. Y lo haremos siempre porque SABEMOS de bolas y strikes. Sabemos que más strikes que bolas siempre serán buenos y los lanzadores que pueden hacer eso suelen tener más éxito.

K% -BB% y (k-bb)/ip (llamémosles las estadísticas K-Bs) son un par de estadísticas que existen solo por las bolas y strikes. Resumen de manera directa el logro que tiene un lanzador sobre los dos resultados principales en los que puede influir más directamente durante una salida: ponches y boletos.

La tasa de ponches (K%) y la tasa de boletos o bases por bolas, (BB%) son cálculos sobre la frecuencia con la que un lanzador poncha o da boleto a los bateadores por aparición al plato (PA). Puede calcularlos dividiendo el número total de ponches o boletos otorgados por un lanzador entre las apariciones en el plato que los bateadores obtuvieron contra él durante un período de tiempo (una semana, mes, temporada, etc.). Luego, con el fin de obtener K% -BB%, simplemente resta y eso es todo.

(k-bb)/ip es similar pero restas primero los ponches menos la base por bolas y luego divides el resultado entre las entradas lanzadas. La razón de esto (y comparativamente dividir entre apariciones al plato para K% -BB%) es obtener proporciones o tasas que nos permitan comparar lanzadores que han enfrentado cantidades muy diferentes de bateadores.

Si está interesado, puede encontrar más información sobre estas estadísticas aquí. Por cierto, Bill James no era fanático de ellas hace unos 10 años, pero Tom Tango sí. Lo que más me intriga acerca de las estadísticas es saber si podrían usarse para anticipar cómo le irá a un lanzador después, su capacidad de predicción, por lo que voy a hacer algunos cálculos para tratar de aclarar eso. Algunas personas han escrito algo sobre esto, pero sus conclusiones no están tan claras para mí, así que investigué por mi cuenta.

Primero, obtuve datos de los lanzadores durante la temporada 2019: el interés principal está en K% – BB% y (k-bb) / ip, por supuesto, y también en ERA y algunos otros estimadores de ERA como xFIP y SIERA. Tenga en cuenta que incluyo además, para comprobar consistencia, otro estimador llamado CSW, que en 2019 ya se demostró que tenía una gran correlación con SIERA y podría ser especialmente útil como estadística de predicción.

Los lanzadores se restringieron a aquellos que tenían al menos 23 o más juegos iniciados, ya que quería abridores con muchas entradas lanzadas para una muestra más grande.

2019 Pitching data.

NameCSW(k-bb)/ipK%-BB%ERAFIPxFIPSIERAGSIP
Gerrit Cole0.35663301.31070250.34000002.502.642.482.6233212.1
Chris Sale0.34266021.23045550.29500004.403.392.933.0025147.1
Max Scherzer0.34259931.22022080.30300002.922.452.882.9327172.1
Justin Verlander0.34019721.15695070.30400002.583.273.182.9534223
Jacob deGrom0.30603581.03431370.26200002.432.673.113.2932204
Shane Bieber0.33103241.02288650.25500003.283.323.233.3633214.1
Matthew Boyd0.31719051.01566720.23800004.564.323.883.6132185.1
Blake Snell0.33950291.00000000.24200004.293.323.313.5623107
Walker Buehler0.31430580.97748490.24200003.263.013.373.5030182.1
Yu Darvish0.32057580.97081930.23600003.984.183.393.5531178.2
Lucas Giolito0.32622600.97048810.24200003.413.433.663.5729176.2
Charlie Morton0.32685570.94232750.23200003.052.813.283.5433194.2
Stephen Strasburg0.32210400.93301440.23200003.323.253.173.4933209
Lance Lynn0.29074020.89860640.21400003.673.133.853.8333208.1
Jack Flaherty0.31204780.89750130.22800002.753.463.643.6833196.1
James Paxton0.29793620.87217040.20700003.823.864.033.9329150.2
Chris Paddack0.30087720.87018540.21400003.333.954.053.8326140.2
Robbie Ray0.32082250.86731760.20300004.344.293.764.0233174.1
Patrick Corbin0.29918160.83168320.20100003.253.493.593.8833202
Clayton Kershaw0.29902690.83099380.21000003.033.863.503.7728178.1
German Marquez0.30428130.80459770.19400004.764.063.543.8528174
Trevor Bauer0.30865200.80281690.18800004.484.344.334.1434213
Domingo German0.30618600.79720280.19200004.034.724.224.0624143
Jake Odorizzi0.28094730.78616350.19000003.513.364.334.1430159
Sonny Gray0.30663460.78241010.19400002.873.423.653.9731175.1
Luis Castillo0.31000630.77287070.18800003.403.703.483.9532190.2
Madison Bumgarner0.28729960.77220080.19000003.903.904.314.1534207.2
Noah Syndergaard0.30403880.77079110.18400004.283.603.834.0232197.2
Kenta Maeda0.32511300.77023500.18900004.043.954.044.0626153.2
Michael Pineda0.28489900.76712330.18600004.014.024.304.1826146
Hyun-Jin Ryu0.29083520.76289790.19200002.323.103.323.7729182.2
Max Fried0.29400750.76271190.17900004.023.723.323.8330165.2
Zack Greinke0.29778350.75408260.19400002.933.223.743.9633208.2
Zack Wheeler0.27920230.74320860.17600003.963.484.064.2031195.1
Vince Velasquez0.26933960.74295470.16900004.915.214.754.3623117.1
Chris Archer0.30695900.73825500.16700005.195.024.364.3823119.2
Aaron Nola0.32322930.73725880.17500003.874.033.824.1434202.1
Tyler Mahle0.30529170.73529410.17100005.144.663.994.1625129.2
Jose Berrios0.29757340.71964020.17100003.683.854.324.2832200.1
Anthony DeSclafani0.27361320.70998800.17000003.894.434.304.2931166.2
Caleb Smith0.28673430.70542130.16700004.525.115.054.5828153.1
Joe Musgrove0.28716600.69370960.16500004.443.824.314.3131170.1
Eduardo Rodriguez0.28869810.67946820.16100003.813.864.104.3134203.1
Kyle Hendricks0.29725720.66666670.16200003.463.614.264.3830177
Jon Lester0.26454160.66004670.14800004.464.264.354.4931171.2
Chris Bassitt0.27695470.65277780.15300003.814.404.614.4725144
Kyle Gibson0.28509410.65000000.14800004.844.263.804.2529160
Ryne Stanek0.29615380.64935060.15300003.974.284.724.472777
Tanner Roark0.25334220.64809210.14800004.354.674.644.5731165.1
Jordan Lyles0.27728010.64539010.15200004.154.644.614.5328141
Dylan Bundy0.29877610.64516130.14800004.794.734.584.5430161.2
Mike Minor0.29422280.63431040.15300003.594.254.604.5132208.1
Steven Matz0.28386380.63085570.14600004.214.604.334.4730160.1
Jon Gray0.28908550.62666670.14800003.844.063.894.3525150
Joey Lucchesi0.28982220.62500000.14800004.184.174.364.4830163.2
Jose Quintana0.27388540.61988300.14200004.683.804.204.5031171
Cole Hamels0.29030910.61614730.14100003.814.094.384.5527141.2
Miles Mikolas0.27729330.60869570.14700004.164.274.184.3932184
Jakob Junis0.28229670.60536840.13800005.244.824.634.6331175.1
Daniel Norris0.28208390.60374740.14300004.494.614.554.5729144.1
Masahiro Tanaka0.28597060.59890110.14300004.454.274.294.4631182
Homer Bailey0.27856140.58859600.13800004.574.114.434.6031163.1
Spencer Turnbull0.25892520.58744090.13300004.613.994.634.6230148.1
Eric Lauer0.26733070.58310990.13400004.454.234.774.7229149.2
Mike Soroka0.27688700.57979330.14400002.683.453.854.2829174.2
Trent Thornton0.27618700.57105780.13000004.844.594.944.8029154.1
Reynaldo Lopez0.27853300.56521740.12900005.385.045.274.8833184
J.A. Happ0.25964390.56486650.13500004.915.224.784.7230161.1
Rick Porcello0.26486490.56289490.12700005.524.765.144.8632174.1
Merrill Kelly0.27413910.55161110.13000004.424.514.584.7332183.1
Marcus Stroman0.27797830.54861490.13000003.223.723.994.4132184.1
John Means0.25139870.53548390.13000003.604.415.485.0227155
Jhoulys Chacin0.27352190.53346270.11700006.015.885.034.9424103.1
Chase Anderson0.26588630.53237410.12500004.214.835.264.8927139
Danny Duffy0.27579820.52995390.12400004.344.785.144.8923130.2
Trevor Richards0.27860260.52553660.12200004.064.515.094.8923135.1
Adam Wainwright0.28129350.51985980.11900004.194.364.394.7031171.2
Jordan Zimmermann0.27652730.50892860.11300006.914.794.874.9323112
Mike Leake0.26789920.50761420.12000004.295.194.764.7932197
Jeff Samardzija0.25182970.50248480.12300003.524.595.024.9232181.1
Zach Eflin0.27460130.49662780.11500004.134.854.764.8628163.1
Trevor Williams0.25999140.47520660.10900005.385.125.255.0826145.2
Wade Miley0.26212940.47277080.10900003.984.514.524.8033167.1
Anibal Sanchez0.26542750.45783130.10600003.854.445.105.0730166
Julio Teheran0.26745720.45350170.10500003.814.665.265.1133174.2
Marco Gonzales0.27289600.44827590.10500003.994.155.115.0834203
Jake Arrieta0.27144160.43639050.09900004.644.894.464.8224135.2
Martin Perez0.26370850.41187160.09200005.124.664.695.0129165.1
Yusei Kikuchi0.25836090.40942930.09200005.465.715.185.1732161.2
Jason Vargas0.27664670.40884720.09400004.514.765.445.2529149.2
Mike Fiers0.26560880.39630840.09700003.904.975.195.1933184.2
Michael Wacha0.24602090.38827260.08700004.765.614.805.0824126.2
Aaron Sanchez0.26724510.35850500.07800005.895.255.155.2827131.1
Ivan Nova0.23826960.35828880.08300004.724.984.915.1634187
Sandy Alcantara0.26658040.35514970.08300003.884.555.175.2832197.1
Andrew Cashner0.25846280.33333330.07900004.684.665.115.2023150
Zach Davies0.24850750.32035180.07600003.554.565.205.4331159.2
Brad Keller0.25083000.31496060.07300004.194.354.945.2328165.1
Glenn Sparkman0.23692310.29411760.06600006.025.935.815.5923136
Dakota Hudson0.26544940.28702640.06600003.354.934.555.0832174.2
Brett Anderson0.24595710.23295450.05500003.894.574.795.1731176
Antonio Senzatela0.23290120.15297910.03300006.715.445.125.5025124.2

SIERA es aclamada casi universalmente como uno de los mejores estimadores de ERA e inicialmente quiero verificar cuál es la correlación entre las estadísticas K-Bs y la misma. Primero, creé gráficos para la relación entre ERA, xFIP y SIERA con los K-Bs y tracé la línea de tendencia, su ecuación y R2 para cada uno:

(k-bb)/ip Vs estimadores de Era, correlación (2019)
K%-BB% Vs estimadores de Era, correlación (2019)

Como se esperaba, debido al impacto de Ks y BBs en su fórmula, SIERA tiene el R2 más alto, lo cual es excelente, ya que indica la varianza más baja y eso lleva a pensar que estas estadísticas más simples pueden usarse con resultados equivalentes a SIERA. Pero si realmente quiero ir un paso más allá, debería comparar las K-Bs 2018 con el SIERA 2019 y verificar la correlación para tratar de descubrir cualquier previsibilidad real.

Al extraer los datos y graficarlos obtenemos:

Promisorio.

Al principio, solo podíamos interpretar que, como lo muestran los valores de R2, la concurrencia en SIERA 2019 debido a 2018 (k-bb) / ip o 2018 K% -BB% es 44% y 48% respectivamente y eso podría ser demasiado bajo para ser significativo. Con ese pensamiento, estaríamos en lo correcto y lo incorrecto al mismo tiempo, siendo varianza la palabra clave y factor decisivo aquí.

Como Phil Birnbaum explica gentilmente en esta publicación, la mayoría de las veces R2 dice mucho desde el punto de vista estadístico y su valor es importante, pero, en términos llanos, el coeficiente de correlación R (la raíz cuadrada de R2) es más informativo y útil. R nos dice que la correlación es de alrededor del 66% y 70% para (k-bb)/ip y K%-BB% respectivamente, lo cual es bueno y potencialmente indica que estas estadísticas pueden usarse para predecir el rendimiento de un lanzador.

Hay mucha más verificación de datos que debo hacer, de hecho, usar más temporadas ayudaría ya que la muestra será más grande, pero este pequeño ejercicio demuestra que las K-Bs son buenas herramientas para hacer estimaciones informadas sobre el futuro desempeños de los lanzadores. Puede parecer que he reinventado la rueda, pero te sorprendería cuánto la gente tiende a subestimar estas estadísticas, por lo que cualquier impulso a nuestra confianza en ellas es importante.

Entonces, ¿qué podemos hacer con K%-BB% y (k-bb)/ip que conduzca a información útil y práctica? Bueno, dediqué un artículo a la evaluación de los 50 mejores lanzadores que entrarán en la temporada 2020 de acuerdo con estas estadísticas de 2019 y hay algunas sorpresas que creo que deberías considerar. Alerta de spoiler: deberías intentar conseguir a Matthew Boyd. Y Kevin Gausman podría tener una temporada muy decente.

El béisbol es un juego tan maravilloso que, además de las alegrías de simplemente verlo, nos ha regalado la alegría de medirlo y analizarlo hasta el infinito. Puede ser, y es, medido más allá del ridículo, lo que puede ser una bendición o una maldición ya que separar las agujas del heno parece muchas veces complicado. Pero no tiene que ser así; lo bueno de tener tanta información disponible es que, si podemos entenderlas, las diversas formas de ver nuestro querido juego aumentan nuestra apreciación: si el conocimiento es poder, el conocimiento aplicado es sabiduría. Intentemos ser sabios o morir en el intento.


Toda la data usada fue tomada de https://www.fangraphs.com/, https://baseballsavant.mlb.com/ y/o https://www.baseball-reference.com/, a menos que se diga algo distinto.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.