jueves, 1 de diciembre de 2022

Robot deporte

Análisis de búsqueda

¿Cómo encontramos jugadas similares en el deporte? ¿Cómo buscamos a través de la historia de un deporte para encontrar situaciones similares a la que nos interesa comparar? Una forma es usar la semántica deportiva y buscar usando palabras clave como una jugada de "tiro de 3pt" en baloncesto, una jugada de "pick and pop" o una jugada "en la parte superior de la línea de 3pt". Sin embargo, si queremos saber dónde se encontraban todos los jugadores en una jugada, su velocidad o su aceleración, así como todos los eventos que condujeron a ese punto, necesitaríamos usar demasiadas palabras para describir esa jugada en particular con mucha precisión. En otras palabras, buscar en la historia de un deporte una jugada similar usando solo palabras clave no captura la ubicación y los movimientos de los jugadores y la pelota y no proporciona una clasificación de cuán similares son las jugadas encontradas a la jugada original con la que queremos compararlas.

Una solución a este problema es utilizar datos de seguimiento como lo hace

Zcode System

El seguimiento de datos es una representación de baja dimensión de lo que vemos en el video. Por lo tanto, en lugar de usar palabras clave para encontrar una jugada similar, podríamos usar una instantánea de una jugada utilizando datos de seguimiento como entrada en una consulta de búsqueda visual. Los usuarios podrían interactuar con una consulta de búsqueda visual donde describen el tipo de juego que desean buscar y la herramienta de consulta generaría un conjunto de jugadas similares clasificadas por el grado de similitud con la obra que se consulta.

 Ver las imágenes de origen

Consulta de búsqueda visual de jugadas similares (Fuente: Patrick Lucey en Stats Perform)

Este tipo de herramienta de búsqueda visual basada en datos de seguimiento puede ofrecer la posibilidad de dibujar la jugada a buscar. También puede ofrecer la posibilidad de mover a los jugadores por la cancha y usar las métricas esperadas para mostrar la probabilidad de que un jugador anote desde varias posiciones. Incluso puede mostrar los cambios en la probabilidad de anotar en función de la posición de los jugadores defensivos en relación con el jugador con el balón.

Simulación de juego

La tecnología en los deportes está entrando al margen. El tipo de tecnología que los entrenadores necesitan para evaluar jugadas durante un juego y simular diferentes resultados debe ser altamente interactivo. Una forma en que Stats Perform ha utilizado los datos de seguimiento para mejorar las simulaciones de juego es a través del ghosting. La idea del ghosting es mostrar los movimientos de juego promedio al mismo tiempo que el juego en vivo representado con puntos en un diagrama del campo. Por ejemplo, los datos de seguimiento pueden mostrar el equipo local en un color (azul) y el equipo visitante en otro color (rojo), pero también puede agregar un tercer equipo defensivo en un color diferente (blanco) que representa cómo el equipo promedio de la liga defendería esa misma situación. (Zcode System Review)

Otra forma en que Stats Perform está trabajando con los entrenadores al margen para proporcionar simulaciones de juego más interactivas es a través de bocetos de juego interactivos en tiempo real. Un entrenador puede dibujar una jugada que quiere que sus jugadores realicen en su portapapeles y lo que los datos de seguimiento y la tecnología pueden hacer es hacer portapapeles inteligentes que puedan simular cómo se desarrollaría esa jugada dibujada por el entrenador.

Realizar pronósticos deportivos más profundos

Cuantos más datos granulares estén disponibles, mejor podremos predecir el rendimiento deportivo. Algunas de las aplicaciones de los datos de seguimiento en el pronóstico incluyen el reclutamiento de jugadores (es decir, qué jugadores comprar, intercambiar, reclutar u ofrecer contratos más largos) y las predicciones de partidos (es decir, predecir con precisión el resultado final, el puntaje y las estadísticas de un partido tanto antes de que se lleve a cabo el partido como en juego).

Reclutamiento de jugadores

En la NBA, Zcode Predictor la liga tiene un buen nivel de cobertura para el seguimiento de datos. Pero, ¿qué sucede cuando un equipo quiere reclutar a alguien de la universidad? Es posible que los datos de seguimiento no existan en las ligas universitarias, lo que obliga a los equipos a usar una versión muy simplificada de los informes para pronosticar cómo jugará ese jugador una vez que sea reclutado en el equipo.

Esto resalta el problema del seguimiento de la cobertura de datos. Las Grandes Ligas tienen ese nivel de datos de seguimiento detallados, pero la mayoría de las ligas inferiores y las competiciones académicas no lo hacen. Además, los partidos históricos de las principales ligas y deportes anteriores a la era de los datos de seguimiento no habrán tenido los sistemas y equipos en su lugar en ese momento para producir datos de seguimiento altamente detallados. Aquí es donde la generación de datos de seguimiento a través de secuencias de video transmitidas puede llenar ese vacío.

El seguimiento de Zcode los datos utilizando imágenes de transmisión es el método definitivo para producir datos de reclutamiento detallados. Los analistas pueden retroceder en el tiempo y producir datos de todos los jugadores previamente no rastreados simplemente usando las imágenes disponibles de juegos anteriores. Stats Perform logra esto a través de AutoStats. AutoStats es un sistema de captura de datos que puede identificar dónde se encuentran los jugadores aunque la cámara esté en constante movimiento aplicando una calibración continua de la cámara. Detecta la postura corporal de los jugadores y puede volver a identificar a un jugador una vez que ese jugador vuelve a la vista después de haber abandonado el marco. Además, AutoStats utiliza el reconocimiento óptico de caracteres para recopilar el juego y el reloj de disparo en cada fotograma, así como el reconocimiento de acciones para rastrear la duración de los eventos del jugador a nivel de cuadro.

Una vez que se han generado los datos de seguimiento de ligas inferiores o juegos universitarios, se puede aplicar el pronóstico basado en IA para descubrir qué otros jugadores profesionales es el jugador explorado de interés más similar. Estas soluciones pueden incluso proyectar el rendimiento futuro de la carrera de un jugador joven. Puede utilizar modelos de predicción a partir de datos históricos de ex novatos y sus eventuales éxitos para pronosticar el rendimiento futuro de los prospectos actuales.

Dada la cobertura limitada de los datos de seguimiento en las ligas inferiores y juveniles, otro método para superar esa limitación es utilizar los datos de eventos ya recopilados para maximizar el valor de la cobertura en los datos de eventos en comparación con los datos de seguimiento. El aprendizaje automático puede definir los atributos específicos de dos jugadores para luego compararlos entre sí. Estos atributos pueden ser atributos espaciales, como dónde reciben normalmente el balón, atributos contextuales, como el estilo de juego de su equipo (es decir, frecuencia de contraataques, presión alta, cruces, jugadas directas, jugadas de acumulación, etc.) y atributos de calidad, como métricas esperadas para capturar el valor y el talento de cada jugador. Este método puede proporcionar una comparación clara de dos jugadores diferentes en relación con el contexto en el que juegan. Por ejemplo, con qué frecuencia está involucrado un jugador en relación con el estilo de juego de una situación particular.

Tomando todos estos datos y los atributos derivados de los datos de eventos, puede ejecutar modelos no supervisados, como la agrupación de modelos de mezcla gaussiana, para descubrir agrupaciones de jugadores en función de sus similitudes y, a continuación, crear una serie de agrupaciones de jugadores únicas que dividan grupos de jugadores. Estos grupos pueden mostrar información sobre los roles que desempeñan los diferentes grupos de jugadores en sus equipos, ya sean "motores de zona", "creadores de juego", "tomadores de riesgos", "facilitadores", "conductores", "portadores de pelota" o cualquier otro grupo que pueda surgir de la aplicación de métodos no supervisados. De esta manera, si un equipo quiere encontrar un jugador similar a un jugador exitoso específico (es decir, jugadores similares a Messi), pero con algunos atributos que son ligeramente diferentes (es decir, edad, liga, etc.), pueden especificar ese criterio de búsqueda y encontrar jugadores que se ajusten al perfil que buscan.

 

Predicciones de partidos

Hay un par de formas en que la IA puede ayudar en las predicciones de partidos. Uno de ellos es implícitamente a través de datos de fuentes múltiples. Los mercados de predicción, como el intercambio de apuestas, facilitan un mercado para que los clientes apuesten por el resultado de eventos discretos. Es un método de crowdsourcing, y si hay suficientes participantes para representar toda la sabiduría colectiva del mercado, con suficiente diversidad de información e independencia de decisiones de manera descentralizada, es el mejor predictor que puede obtener. Es un mercado implícito, ya que no sabemos la razón por la cual las personas han hecho sus elecciones de apuestas, por lo tanto, no es interpretable. Si suficientes personas están participando en estos mercados, entonces toda la información posible para hacer una predicción está presente en ese mercado. Si ese es el caso, no es posible superar la precisión de esa predicción del mercado.

Otro método es utilizar un enfoque explícito basado en datos utilizando solo datos de coincidencias históricas junto con técnicas de aprendizaje automático para predecir las probabilidades de los resultados de las coincidencias. Este método se basa en la precisión y profundidad de los datos disponibles y solo puede capturar el rendimiento presente dentro de los puntos de datos recopilados. La ventaja de utilizar un enfoque basado en datos es que puede ser interactivo e interpretable. Además, solo necesita la alimentación de datos de eventos, lo que lo hace escalable. Sin embargo, dado que no todos los datos pueden capturarse en el conjunto de datos utilizado (es decir, datos sobre lesiones), puede haber lagunas en el análisis que puedan afectar a las predicciones realizadas.

Las casas de apuestas normalmente utilizan un enfoque híbrido de datos de fuentes múltiples junto con métodos basados en datos para equilibrar la acción en ambos lados de la apuesta y también para administrar su nivel de riesgo. Inicializan el mercado con un enfoque basado en datos e intuición humana y luego iteran en función del volumen, otras líneas de apuestas deportivas y cualquier incentivo único que quieran ofrecer a sus propios clientes.

Las soluciones basadas en IA y los datos de seguimiento se pueden utilizar para respaldar estos mercados de predicción, particularmente en aquellos mercados con cobertura insuficiente para lograr la sabiduría de la multitud. Una forma de hacerlo es a través del cálculo de la probabilidad de ganar. La probabilidad de ganar se utiliza ampliamente en casi todos los deportes con fines mediáticos. La limitación actual de la probabilidad de ganar es que se basa en la probabilidad de que un equipo promedio gane dada una situación de partido particular. Sin embargo, simplemente usar un promedio puede perder información contextual sobre las fortalezas específicas de equipos o jugadores particulares involucrados. La forma de superar eso es utilizar modelos específicos que incorporen a los jugadores, equipos y alineaciones del partido en cuestión.

Stats Perform utiliza modelos que aprenden representaciones compactas con características como el oponente específico, los jugadores involucrados y otras características en bruto que describen la alineación para mejorar el rendimiento de la predicción en función de los jugadores involucrados en el juego. Esto les permite crear accesorios específicos para los jugadores que pueden predecir las estadísticas individuales de los jugadores (es decir, los puntos esperados anotados en el balonces

to) para cada jugador en la alineación e ilustrar el rendimiento futuro del juego de ese jugador antes de que comience el juego.


Inteligencia artificial en el deporte

Diferentes tipos de datos deportivos

Robot de prediciones deportivas: Zcode System

Ver las imágenes de origen

 Predicciones sobre una serie de deportes diferentes, desde fútbol hasta hockey sobre césped, voleibol y natación utilizando diferentes tipos de datos. Hay 3 tipos principales de datos deportivos disponibles: puntajes de caja, datos de eventos y datos de seguimiento. Todos estos tipos de datos facilitan la reconstrucción de la historia de un partido o una actuación en particular. Sin embargo, cuanto más granulares sean los datos temporales y espaciales de un juego, mejor será la historia que un analista podrá contar.

Estadísticas de box-score

El uso de estadísticas de puntuación de caja de alto nivel (puntuación de partido de medio tiempo, puntuación de partido a tiempo completo, goleadores, tiempo de goles, tarjetas amarillas, etc.) puede resumir un partido de fútbol de 90 minutos para proporcionar una idea de cómo se jugó el juego en solo unos segundos. Las estadísticas básicas de puntuación de caja pueden decirle quién ganó el partido, qué equipo tomó la delantera primero, cuándo se marcaron los goles y qué tan cerca están entre sí. Las estadísticas de puntuación proporcionan una instantánea bastante buena de un juego y un nivel decente de reconstrucción del partido.

 

Las estadísticas de box-score también ofrecen un nivel de información más detallado. Por ejemplo, pueden ilustrar qué equipo tuvo más tiros y la calidad de esos tiros mostrando el número de tiros y tiros a puerta. También pueden explicar la distribución de la posesión entre los equipos en el partido, qué equipo tuvo más córners, cometió más faltas, hizo más atajadas, etc. En pocos segundos pueden capturar la historia del partido, qué equipo dominó o qué tan cerca estuvo ese juego.

Datos del evento

Los datos de eventos, o datos jugada por jugada, proporcionan un poco más de detalle que las estadísticas de puntuación de caja al ofrecer información contextual adicional de momentos clave durante un partido. Por ejemplo, los comentarios jugada por jugada de un partido pueden ofrecer descripciones textuales de lo que ocurrió en cada minuto del partido. Del mismo modo, los datos espaciales del juego (es decir, la ubicación espacial de los jugadores) pueden proporcionar reconstrucciones visuales de algunos de los eventos clave en un partido, como la forma en que se marcó un gol en particular. Si bien no es lo mismo que ver el video, es una vista digitalizada rápida del juego del mundo real que se puede reconstruir en segundos.

Zcode es uno de los líderes de la industria en la recopilación de datos de eventos. Proporcionan datos de eventos a las casas de apuestas deportivas a través de un feed de baja latencia que les dice cuándo ocurre un gol, un disparo, un ataque peligroso o cualquier otro momento clave casi en tiempo real para que las casas de apuestas deportivas puedan transmitir esa información a sus apostadores. En estos casos, la velocidad de los datos es crucial, no solo para reconstruir una historia de lo que sucede en el campo a través de los datos, sino para poder contar esa historia de manera casi inminente.

Datos de seguimiento

El seguimiento de los datos es actualmente el nivel más detallado de datos que se capturan en los deportes. Permite la proyección de la ubicación de todos los jugadores y la pelota en un diagrama del campo que mejor reconstruye un partido a partir de las imágenes de video sin procesar de ese partido. Tener una representación digital a través de datos de seguimiento de todos los jugadores en todo el campo permite a los analistas realizar mejores consultas que simplemente usar una fuente de video que solo muestra una subsección del campo.

La NFL ahora está utilizando dispositivos portátiles de identificación por radiofrecuencia (RFID) implementados en las hombreras de los jugadores para rastrear las coordenadas x e y de la ubicación de cada jugador en el campo.

Radar

En el golf, Zcode System Review también se ha implementado un radar y otra tecnología de sensores para rastrear la trayectoria de la pelota y producir visualizaciones sorprendentes con una detección muy precisa de la pelota.

GPS Wearables

El fútbol y otros deportes de equipo utilizan dispositivos GPS que, aunque no son tan precisos como RFID, pueden rastrear datos adicionales del atleta, como la frecuencia cardíaca y el nivel de esfuerzo. Estos dispositivos portátiles tienen la ventaja de que se pueden utilizar en un entorno de entrenamiento, así como en un partido competitivo.

Datos de mercado (sabiduría de las multitudes)

Los datos de mercado en los deportes generalmente se refieren a los datos de apuestas. Es una forma implícita de reconstruir la historia del partido que se basa en que las personas hagan sus predicciones de dónde se puede extraer información.

Análisis deportivo impulsado por IA

El análisis deportivo se ha basado tradicionalmente en datos de puntuación y eventos. Desde la campaña de base de Bill James de 1981 Project Scoresheet, que tenía como objetivo crear una red de fanáticos para recopilar y distribuir información de béisbol, hasta la integración de Daryl Morey del análisis estadístico avanzado en los Houston Rockets en 2007.

Sin embargo, en la década de 2010, los datos de seguimiento comenzaron a establecer un nuevo camino hacia nuevas formas de analizar los deportes. Durante la última década, ha surgido una nueva era de análisis deportivo que maximiza el valor de los datos tradicionales de puntuación de caja y eventos al complementarlos utilizando datos de seguimiento más profundos. La revolución de la IA en los deportes gracias a los datos de seguimiento se ha centrado en tres áreas clave:

1.   Recopilaciónde datos más profundosmediante visión artificial o wearables

2.   Realizar unanálisis de tipo más profundocon esos datos de seguimiento que los humanos no podrían hacer sin IA

3.   Realizarpronósticos más profundospara obtener mejores predicciones

Recopilación de datos deportivos más profundos

El objetivo principal de recopilar datos deportivos Zcode Predictor es reconstruir la historia de un partido lo más cerca posible de la que se ve por las imágenes en bruto que un humano o una cámara pueden ver. Los datos brutos recopilados de este metraje se pueden transformar en un formulario digitalizado para que podamos leer y comprender la historia del partido y producir algunas ideas procesables.

La reconstrucción de un rendimiento con datos generalmente comienza segmentando un juego en partes digeribles, como posesiones. Para cada parte de este juego, tratamos de entender lo que sucedió en esa posesión (es decir, cuál fue el resultado final de la posesión), cómo sucedió (es decir, describir los eventos que llevaron al resultado de esa posesión) y qué tan bien se hizo (es decir, qué tan bien se ejecutaron los eventos).

Actualmente, la forma en que se digitalizan los datos deportivos jugada por jugada a partir de las imágenes de video es a través del trabajo de los analistas de video. Los humanos ven un juego y anotan los eventos que tienen lugar en el video (o en vivo en el lugar deportivo) a medida que ocurren. Este método de recolección de datos de juego por juego produce un relato de los eventos de fin de posesión que describe lo que sucedió en una jugada o posesión en particular. Sin embargo, cuando se trata de entender cómo sucedió esa obra o qué tan bien se ejecutó, los sistemas de notación humana no producen la mejor información para reconstruir con precisión la historia. Los seres humanos tienen limitaciones cognitivas y subjetivas al capturar un nivel muy granular de información manualmente, como obtener el marco de tiempo preciso de cada evento o proporcionar una evaluación objetiva de qué tan bien se ejecutó una jugada.

Robot deporte

Análisis de búsqueda ¿Cómo encontramos jugadas similares en el deporte? ¿Cómo buscamos a través de la historia de un deporte para encontra...