[ad_1]

La primera proyección del equipo ZiPS para 2021 se activará el miércoles. Como de costumbre, este es un buen lugar para recordar qué es ZiPS, qué está intentando ZiPS y qué, quizás lo más importante, qué no es ZiPS.

ZiPS es un sistema de proyección por ordenador que desarrollé entre 2002 y 2004 y que se puso oficialmente en funcionamiento para la temporada 2004. Los orígenes de ZiPS son similares a los de Tom Tango, Marcel the Monkey, quien surgió de conversaciones con Chris Dial, uno de mis mejores amigos y colegas, a fines de la década de 1990 (¡mi primera interacción con Chris incluyó ser etiquetado como explosivo!) . ZiPS se ha alejado rápidamente de su introducción original como un sistema de proyección relativamente simple: hace mucho más ahora y usa muchos más datos de lo que jamás imaginé hace 20 años. En esencia, sin embargo, todavía realiza dos tareas básicas: estimar cuál será la expectativa básica para un jugador cuando presione el botón; y luego estimar hacia dónde podría ir ese jugador utilizando grandes cohortes de jugadores relativamente similares.

ZiPS utiliza estadísticas de varios años, y las temporadas más recientes reciben más peso. Inicialmente, a todas las estadísticas se les dio la misma ponderación anual, pero con el tiempo esta se volvió más diversa debido a investigaciones adicionales. La investigación es una gran parte de ZiPS, y cada año hago literalmente cientos de estudios sobre varios aspectos del sistema para determinar su valor predictivo y calibrar mejor las líneas de base de los jugadores. Lo que comenzó con los datos disponibles en 2002 se ha ampliado considerablemente: los datos básicos sobre golpes, velocidad y tono jugaron un papel más importante a partir del 13 en adelante. y los datos derivados de StatCast se ingirieron durante los últimos años a medida que me familiaricé con el valor predictivo y el impacto de estos números en los modelos existentes. Creo en un diseño cuidadoso y conservador, por lo que los datos solo se incluirán si confío en una mayor precisión. Siempre hay versiones de ZiPS que aún faltan algunos años. Se utilizan herramientas ZiPS internas adicionales como ABIP, zHR, zBB y zSO para determinar mejor las expectativas básicas de los jugadores. Estas estadísticas funcionan de manera similar a los diferentes tipos de estadísticas «x», ¡con la z para algo que apuesto a que ya has descubierto!

Al estimar la producción futura de un jugador, ZiPS compara su desempeño base en calidad y forma con el desempeño base de cada jugador en su base de datos en cualquier momento de su carrera. Esta base de datos contiene todas las grandes ligas desde la era Deadball (el juego era tan diferente antes de eso que encontré compilaciones antes de Deadball haciendo las proyecciones menos precisas) y todas las traducciones de las ligas menores desde finales de la década de 1960. Utilizando técnicas de análisis de clústeres (la eliminación de Mahalanobis es una de mis herramientas favoritas), ZiPS reúne una cohorte de jugadores bastante similares a lo largo de la historia para compararlos, que se ven en la lista de composiciones más similares. Los factores no estadísticos incluyen la edad, la posición, la mano y, en menor medida, la altura y el peso en comparación con la altura y el peso promedio de la época (desafortunadamente, estos datos no son muy buenos). Luego, ZiPS genera una curva de envejecimiento probable para cada jugador en muy poco tiempo, tanto las proyecciones del punto central como el alcance. Este método fue desarrollado por PECOTA y por el Analista de béisbol Elias a finales de los 80 y creo que es el mejor enfoque. Después de todo, hay pocos datos experimentales en el béisbol; La única forma en que sabemos cómo envejecen los matones pisoteadores es observar cómo envejecen los matones pisoteadores.

Uno de los principios de las proyecciones que sigo es que, independientemente de la proyección, esta es la proyección ZiPS. Incluso si incluir mi opinión mejoraría una cierta proyección, estoy filosóficamente en contra. ZiPS es más útil cuando la gente sabe que se basa puramente en datos, no en una combinación desconocida de datos y en mi opinión. A lo largo de los años, me gusta pensar que he adoptado un enfoque inteligente para convertir más cosas en datos, como el uso de ZiPS de información básica sobre lesiones, pero algunas cosas simplemente no están en el modelo. ZiPS no sabe si a un lanzador no se le permitió lanzar su slider después de una lesión o si un jugador de campo izquierdo sufrió una tragedia familiar en julio. Miro estas cosas fuera del alcance de un sistema de proyección, aunque pueden afectar el rendimiento en el sitio.

También es importante recordar que la conclusión es que para la gente común, la proyección es solo un punto central. No esperan que todos los jugadores alcancen este punto medio. Se espera que el 10% de los jugadores no supere la proyección del percentil 10, y se espera que el 10% de los jugadores pase la proyección del percentil 90. Este punto puede resultar sorprendentemente confuso. ZiPS dio 300 proyecciones BA a tres jugadores en 2020: Luis Arraez, Jose Altuve (¡uy!) Y Christian Yelich (¡doble uy!). Pero eso no es lo mismo que ZiPS cree que solo habría tres .300 hits. ZiPS en realidad pronosticó 41,300 hits, que es más de lo habitual en una temporada muy corta, y 39 jugadores con al menos 100 apariciones récord lo hicieron.

Otro punto importante a tener en cuenta es que las proyecciones básicas de ZiPS no son predictores de tiempo de juego. Por naturaleza, ZiPS no tiene idea de quién jugará realmente en las mayores en 2021. ZiPS esencialmente predice una producción equivalente. Un bateador con una proyección de .240 puede «en realidad» tener una proyección de .260 triple A o una proyección de .290 doble A. La forma en que un Julio Rodríguez anotaría a tiempo completo en las mayores en 2021 es un uso mucho más interesante de un sistema de proyección que decirme que no va a jugar en las mayores, o al menos solo un poco. Para los mapas de profundidad que se publican en cada artículo, utilizo los mapas de profundidad de FanGraphs para determinar el tiempo de juego para jugadores individuales. Dado que se trata de la creación de equipos, no puedo transferir ZiPS a mis propios dispositivos para una aplicación de este tipo. Por la misma razón, utilizo mapas de profundidad modificados para las proyecciones del equipo en la temporada. Hay un elemento probabilístico en los mapas de profundidad de ZiPS: a veces, Joe Schmo juega toda una temporada, a veces pierde el tiempo de juego y Buck Schmuck tiene que intervenir. Pero el concepto básico es muy simple.

La lista de tareas pendientes nunca se reduce. Una de las cosas que todavía están en la mesa de dibujo es una mejor ejecución / proyecciones de carreras impulsadas. ZiPS no se diseñó originalmente como una herramienta de béisbol de fantasía (los analistas de béisbol de fantasía han estado haciendo proyecciones de fantasía durante mucho tiempo), pero dado que ZiPS es ampliamente utilizado por los jugadores de fantasía, se están trabajando modelos más sofisticados. Los ahorros, por otro lado, son un tema particularmente difícil. A partir de ahora solo le diré a ZiPS si el rol de un jugador cambiará, lo que determina si ZiPS ve al futuro Mike Moustakas como el segunda o tercera base. Probé muchos atajos como Por ejemplo, tratar de modelar la decisión del gerente sobre quién está más cerca, tanto estadísticas como cosas como edad, salario e historial. Si bien generalmente hace un buen trabajo al proyectar quién estará más cerca, los errores son gigantes y hacen que las proyecciones seguras sean ineficaces. Una decisión de gestión puede transformar una jarra con 35 memorias en una jarra con cinco memorias. Todavía estoy pensando en cómo abordar este problema.

¿Qué hay de nuevo en 2021? No tanto como esperaba originalmente. Quiero tener muchos datos de prueba antes de implementar actualizaciones importantes, y no solo depender de cosas como la validación cruzada. Al final, me gustaría probar las proyecciones y los diversos componentes de las proyecciones contra jugadores que ZiPS nunca ha «visto», no subconjuntos aleatorios de jugadores que ya están «en la masa de las galletas». Mis modelos también se refinaron para BABIP y para las diversas medidas z mencionadas anteriormente, pero nada espectacular.

Las proyecciones de 2021 no se tratan tanto de lo nuevo como de lo que falta: la mayor parte de 2020. Apenas tengo que pensar en por qué faltan datos, pero el hecho es que esto crea un nuevo desafío, uno nuevo un poco de incertidumbre para un sistema de proyección. Con poca historia como guía, profundicé en las temporadas acortadas de 1981 y 1994/1995 y descubrí que el mejor enfoque es simplemente proyectar los juegos que faltan como si los jugadores regresaran en el otoño y terminaran el calendario. Como resultado, el rendimiento de 2020 se pondera mucho más fácilmente que los números más recientes de una temporada que he usado en una proyección.

El factor de despido también es excelente para los jugadores más pequeños. La buena noticia es que los despidos sin lesiones son mucho menos severos en términos de expectativas que los despidos debido a lesiones. Y en este caso, la mayoría de los jugadores están en el mismo bote, e incluso aquellos a los que se les permitió jugar en las mayores solo recibieron dos meses de béisbol, mucha menos ayuda de la habitual.

Las estadísticas de los playoffs están en la mezcla, como lo han estado desde la temporada 2012, si no me equivoco. Por lo general, brindan cierto grado de precisión, estos son juegos reales e importantes contra los competidores más duros, y es de esperar que sean aún más útiles en una temporada en la que faltan tantos juegos. Después de todo, los Tampa Bay Rays extendieron su temporada en un tercio completo mientras jugaban en 20 partidos de playoffs.

¿Tiene alguna pregunta, sugerencia o inquietud sobre ZiPS? Intentaré responder a todas las que pueda abordar adecuadamente en los comentarios a continuación. Si las proyecciones han sido de valor para usted ahora o en el pasado, le insto a que considere unirse a FanGraphs si actualmente tiene la oportunidad. Con su apoyo, he podido poner gran parte de este trabajo a disposición del público de forma gratuita durante tanto tiempo.

[ad_2]