efdeportes.com

La minería de datos como herramienta novedosa 

para el estudio de contrarios en el deporte

The data mining like innovative tool for advanced scouting in the sport

 

Metodólogo de Alto Rendimiento

Instituto Nacional de Deportes, Educación Física y Recreación

Profesor adjunto de la Universidad de Granma, de las asignaturas

Metodología de la Investigación y Estadística

Profesor adjunto de la Facultad de Cultura Física de Granma

Msc. Luis Alberto Sancesario Pérez

rgonzalezg@udg.co.cu

(Cuba)

 

 

 

 

Resumen

          El presente artículo aborda, a partir de una breve caracterización de la economía y el deporte contemporáneos, los aspectos generales relacionados con la Minería de Datos, así como su aplicación en diversos campos de la ciencia y la tecnología, con énfasis en el deporte y, específicamente, en el estudio de contrarios. Se reflexiona acerca de las tendencias actuales y futuras en el uso de la minería de datos en el deporte. Se expone la situación de su empleo y sus limitaciones, en función del estudio de contrarios, en los deportes de combate.

          Palabras clave: Minería de datos. Estudio de contrarios. Inteligencia artificial. Deporte.

 

Abstract

          The present article approaches, starting from a brief characterization of the contemporaries economy and the sport, the general aspects related with the Data Mining, as well as its application in diverse fields of science and technology, with emphasis in the sport and, specifically, in the advanced scouting. It is reflected about the current and future tendencies in the use of the Data Mining in the sport. It is exposed the situation of their use and their limitations, in function of the advanced scouting, in the combat sports.

          Keywords: Data mining. Advanced scouting. Artificial intelligence. Sport.

 

 
EFDeportes.com, Revista Digital. Buenos Aires, Año 16, Nº 165, Febrero de 2012. http://www.efdeportes.com/

1 / 1

Introducción

    El mundo actual está caracterizado, desde el punto de vista económico, por una marcada tercialización, fenómeno donde la riqueza de las naciones se basa, por un lado, en los servicios, y por otro, en la materia gris, en la capacidad de investigación y generación de conocimiento, distinguido además por un predominio cada vez más marcado de la economía inmaterial o del saber, de la cual han sido identificados, como parte de ésta, cuatro grandes componentes: las tecnologías de la información y las comunicaciones; la propiedad intelectual; las bibliotecas y los bancos de datos electrónicos; y la biotecnología y otros sectores emergentes; los cuales han traído consigo un desarrollo acelerado, sobretodo en la producción de conocimiento, que afecta a todas las ramas del saber.

    Como uno de los grandes fenómenos sociales contemporáneos, el deporte, no está ajeno a esta situación, lo cual se ve reflejado en el movimiento deportivo internacional tanto de forma negativa como de forma positiva, ejemplo de manifestaciones negativas los constituyen, la comercialización de atletas, la adaptación constante de la reglamentación de los diferentes deportes a las exigencias de los patrocinadores -que en ocasiones va en detrimento de la salud del atleta-, el exceso de biologización, y el doping y el dopaje.

    Como manifestaciones positivas se observan, la aplicación constante de los últimos hitos científico-tecnológicos en el diseño y desarrollo de implementos deportivos cada vez más ergonómicos y seguros para el competidor, incremento casi exponencial del nivel de practicantes sistemáticos en todas las manifestaciones deportivas, la aplicación de los últimos adelantos de la biomecánica y la computación en el estudio y perfeccionamiento de los movimientos técnicos, así como el desarrollo creciente de modelos matemáticos computacionales sobre comportamiento técnico-táctico y su aplicación en el desarrollo de herramientas inteligentes para el estudio de contrarios y la preparación táctica del atleta, concretamente mediante aplicaciones de Inteligencia Artificial.

    Como una potente herramienta de apoyo a este último aspecto ha hecho aparición, de forma relativamente reciente, la Minería de Datos, herramienta científica acerca de la cual se pretende, en el presente artículo, dar una visión general de su aplicación al proceso de estudio de contrarios en el deporte moderno.

Desarrollo

    Para entender el concepto de estudio de contrarios es preciso partir del análisis del llamado scouting, anglicismo de amplia aplicación hoy en el léxico de todo entrenador deportivo que significa literalmente “exploración, reconocimiento”, y con el cual se acostumbra a identificar dos procesos diferentes:

  1. Al proceso mediante el cual un scout (cazatalentos) identifica, da seguimiento y recluta a atleta/s talentoso/s en determinada disciplina deportiva.

  2. Al proceso mediante el cual un entrenador, o un equipo de estos, estudia las características relevantes al rendimiento deportivo del o los oponentes para identificar sus fortalezas y debilidades, con la finalidad posterior de adoptar decisiones encaminadas a minimizar los riesgos y maximizar las potencialidades de su atleta en oposición a las del adversario.

    Es precisamente este último proceso al cual se le denomina estudio de contrarios o advanced scouting (traducido literalmente al castellano significa exploración avanzada), a partir de su concepto, es posible inferir que para el buen desarrollo de este es conditio sine qua non tener adecuadamente definidos los indicadores que resultan relevantes al rendimiento deportivo, los cuales generalmente se mantienen subyacentes, ocultos a la simple observación rutinaria, cuando esto ocurre, el entrenador apela a su intuición y experiencia práctica, por lo que sus decisiones van marcadas por la subjetividad y acompañadas de un margen de incertidumbre muy elevado, pudiendo cometer el error de considerar elementos que son irrelevantes y a su vez ignorar aquellos de mayor importancia, con lo que cae en errores tácticos que actúan en detrimento del rendimiento de su atleta. El estudio de contrarios complementa, por tanto, al proceso de Preparación Táctica, imbricándose dentro de este.

    Un buen proceso de estudio de contrarios debe responder a las siguientes interrogantes:

  • ¿Cuáles son los indicadores que debo observar porque son los que resultan más relevantes al rendimiento en mi deporte?

  • ¿Cuáles son las fortalezas y debilidades o riesgos de mi atleta considerando el comportamiento de su oponente en estos indicadores?

  • ¿Cuáles son las fortalezas y debilidades o riesgos del oponente considerando el comportamiento de mi atleta en estos indicadores?

  • ¿Cuáles son las jugadas, acciones, técnicas, etcétera, más efectivas para mi atleta en cada situación?

    No es difícil notar que la respuesta a estas cuatro interrogantes implica necesariamente una modelación a priori de lo que puede suceder en el juego, o en el combate, lo cual expresa el carácter predictivo, generalmente estocástico, del proceso.

    Una de las características afines a todos los deportes cuyo indicador fundamental es táctico (como los de juego y los de combate), es la infinidad de situaciones que pueden ser dadas durante cada encuentro, por lo que el entrenador para poder modelar, con un margen de incertidumbre tolerable, la posible efectividad de las acciones durante cada encuentro, deberá manejar una voluminosa cantidad de datos que muy probablemente a simple vista no “dirán” nada, razón por la cual se impone la necesidad de analizar estos mediante un proceso robusto que permita extraer conocimiento implícito en bases de datos, identificar patrones comprensibles, descubrir modelos previamente desconocidos y construir reglas con una finalidad predictiva para su uso en la toma de decisiones, para lo cual deviene como herramienta más novedosa, rápida y eficaz la minería de datos.

Entonces, ¿qué es minería de datos?

    La minería de datos es también comúnmente identificada en la literatura hispana por su nombre en Inglés, Data Mining; según Han y Kamber, citados por Solieman, “(…) abarca herramientas y técnicas para la extracción o ‘minería’ [de] conocimientos de cantidades grandes de datos". (Solieman, 2006)

    La Minería de datos aborda la solución a problemas de predicción, clasificación y segmentación, mediante la obtención de patrones o modelos a partir de un gran cúmulo de datos compilados y en donde dicha información reside de forma oculta, subyacente. Tiene como pilares fundamentales, la informática y la estadística.

    El resultado fundamental de la minería de datos se expresa en forma de modelo matemático, el cual es un tipo de modelo científico definido como “el producto de una abstracción de un sistema real, una forma matemática de expresar declaraciones y/o proposiciones sustantivas de hechos o de contenidos simbólicos, están implicadas variables, parámetros, entidades y relaciones entre variables y/o entidades u operaciones”. (Stewart, 2002)

    Por lo general, las metodologías existentes propuestas para desarrollar procesos de minería de datos coinciden de alguna forma en las siguientes fases:

  • Comprensión del negocio (en nuestro caso, del deporte en cuestión) y del problema que se quiere resolver.

  • Determinación, obtención y limpieza de los datos necesarios.

  • Creación e interpretación de modelos matemáticos.

  • Validación de los modelos matemáticos obtenidos.

  • Comunicación de los resultados obtenidos.

  • Integración, si es posible, de los resultados en un sistema experto u otro similar.

    La minería de datos toma de la estadística entre otras técnicas al Análisis de agrupamiento o clustering, el análisis discriminante, series temporales, análisis factorial, regresión lineal múltiple, regresión no lineal, regresión logística, árbol de clasificación, etcétera. De igual forma, toma de la informática los algoritmos genéticos y la inteligencia artificial (entre los sistemas de inteligencia artificial se incluyen los sistemas expertos, los sistemas inteligentes y las redes neuronales).

    El desarrollo de modelos de minería de datos requiere necesariamente del empleo de aplicaciones informáticas dado el gran número de cálculos y de datos que es preciso manejar. Para tal efecto en la actualidad existen numerosas herramientas de software tanto libres como comerciales tales como KXEN, KNIME, SPSS, SAS Enterprise Miner, R, RapidMiner, Orange y Weka.

Campos de aplicación de la minería de datos al deporte

    No son pocos los ejemplos que confirman la importancia de la minería de datos, siendo sus aplicaciones más conocidas aquellas en el campo de la administración empresarial basada en la relación con el cliente y los patrones de venta y consumo, el reconocimiento de patrones, la biomedicina, finanzas, banca y seguro (obtención de patrones de uso fraudulento de tarjetas de crédito, análisis de riesgos, predicción de clientes que contratan nuevas pólizas, identificación de patrones de comportamiento para clientes con riesgo de impago de préstamos), la investigación criminal, demografía, educación, procesos industriales (detección de piezas con problemas, modelos de calidad, estimación de composiciones óptimas en mezclas, predicción de fallos y accidentes), turismo (determinar las características socioeconómicas de los turistas en un determinado destino o paquete turístico), datos espaciales, y más recientemente en la lucha contra el terrorismo.

    La investigación científica aplicada al deporte también la ha acogido entre sus herramientas, pues ha demostrado ser particularmente efectiva en el desarrollo de aplicaciones para los dos tipos de scouting, o sea, tanto para identificación de talentos como para el estudio de contrarios.

    La investigación biomédica deportiva ha sido otro de los campos donde se han aprovechado sus potencialidades, así por ejemplo, el club de fútbol italiano AC Milan emplea un software para predecir las lesiones de sus jugadores, el cual fue desarrollado por Computer Asociates, con el cual esperan ahorrar millones de dólares por concepto de lesiones prevenidas. (Solieman, 2006)

    La National Football League ha establecido una correlación entre los resultados obtenidos en investigaciones psicológicas mediante el test psicométrico Wonderlic y los requerimientos de inteligencia de cada posición particular, por ejemplo, los Quaterbacks, posición de la cual se cree que es la que demanda mayor inteligencia, promedian 24, mientras que los Running Back promedian 16. (Solieman, 2006)

    La administración de organizaciones deportivas profesionales ha sido también caldo de cultivo para la aplicación creciente de la minería de datos en la toma de decisiones. Cada día son más las organizaciones que contratan como consultores a especialistas en este campo para el desarrollo de sistemas de soporte a decisiones.

    Así por ejemplo, en su famoso libro Moneyball: The Art of Winning an Unfair Game, el escritor Michael Lewis detalla cómo en el beisbolero equipo de los Atléticos de Oakland el gerente general Billy Beane y su staff emplearon minería de datos para diseñar un equipo de bajo presupuesto que podía competir con equipos en mercados más grandes con nóminas más grandes, considerando que los jugadores universitarios contratados cobran tan sólo una fracción de lo que pueden cobrar los veteranos en el mercado de agentes libres. (Lewis, 2003)

    Centró la selección en atletas procedentes de las ligas universitarias y basado más en el rendimiento anterior que en las condiciones físicas y somatotípicas. Asentado en su propia investigación apoyada en minería de datos Beane llegó a la conclusión de que las estadísticas actuales que se emplean en el Béisbol son muy superficiales y engañosas, por ejemplo, descubrieron que era más efectivo considerar la cantidad de hombres en base empujados hasta el home que la cantidad total de carreras impulsadas, dado que este último indicador depende en gran medida de la capacidad que tengan los bateadores precedentes de embasarse.

    Como consecuencia los atléticos eran conocidos por presentar siempre un equipo competitivo. Muchas de sus elecciones, ridiculizadas al principio, se hicieron estrellas del béisbol con posterioridad y a menudo ganadores de premios. Tal es el caso de Barry Zito, que fue reclutado en 1999 y solamente tres años después ganó el premio Cy Young que se otorga al mejor pitcher en cada liga.

La minería de datos aplicada al estudio de contrarios

    Se conoce como la primera incursión de alto éxito en el estudio de contrarios a la aplicación preparada por la reconocida empresa productora de hardware y software IBM para la National Basketball Association (NBA), a mediados de la década de los ’90, la que consistía en un sistema experto llamado Advanced Scout (AS) que, según sus creadores, busca y descubre interesantes patrones en los datos del partido de baloncesto. Con esta información, un entrenador puede medir la efectividad de ciertas decisiones y formular estrategias de juego. (Bhandari, 1997)

    En la temporada de 1995-1996 este software fue distribuido a 16 de los 29 equipos de la NBA. Mientras algunos de los equipos estaban en la etapa temprana de evaluación de su uso otros (como New York Knicks, Orlando Magic, Seattle Supersonics) rápidamente integraron el software a sus procesos de preparación y análisis del partido. (Bhandari, 1997)

    McMurray y Sterba expresan que la retroalimentación positiva recibida de los staffs de entrenadores indicó que dicho software resulta ser una valiosa herramienta. (Bhandari, 1997)

    Al respecto Bob Salmi, mientras se encontraba con los New York Knicks, lo comparaba con el hecho de tener otro entrenador en el equipo. De igual forma, la NBA ha expresado su complacencia porque contribuye a mejorar la calidad de los partidos, lo que provee valor adicional a los aficionados al juego. (Bhandari, 1997)

    Específicamente en Cuba, una de las aplicaciones más paradigmática, y a la vez insuficientemente valorada, ha sido el software desarrollado en el año 2008 por la Universidad de Ciencias Informáticas (UCI) y supervisado por la Comisión Nacional de Béisbol (CNB) y el Centro Investigación e Informática para el Deporte (CINID), bajo el nombre de Sistema de Estudio de Contrarios (SEC) para el Béisbol, el cual es un sistema experto que puede servir a directivos, entrenadores y jugadores para analizar, antes, durante y después del juego, el comportamiento de los jugadores participantes, permitiéndoles mejorar su efectividad en los partidos. (Miño Herrera, 2010)

    A este software con posterioridad, en el año 2010, se le propusieron mejoras, a partir de los datos estadísticos recolectados de la XLVIII Serie Nacional de Béisbol Cuba del 2009 y de la Temporada de Grandes Ligas del mismo año, dado que en aquel primer momento no contaba con “(…) un módulo que tome decisiones tales como la zona donde se le debe lanzar a un bateador determinado en una situación de juego dada o el lanzador más eficaz para relevar en un momento dado dentro del juego.” (Miño Herrera, 2010)

    Uno de los módulos que sí poseía es el de Reportes, que devolvía una información visual bastante exacta de las debilidades y fortalezas de un jugador para diferentes instantes del juego. En cambio no era posible contar con la predicción de posibles jugadas durante el encuentro o con sugerencias relativas al tipo de lanzamiento que pudiera hacerle mayor o menor daño a un bateador en relación con las características del momento del juego. (Miño Herrera, 2010)

Minería de datos y estudio de contrarios en los deportes de combate

    El análisis de la literatura relativa al tema permite reconocer al baloncesto y el béisbol, como los deportes que han hecho un uso más extenso de la minería de datos en sus diferentes campos, quizás por ser dos de los deportes que mayor volumen de datos estadísticos generan, ocurriendo lo contrario en el resto de las disciplinas deportivas, las cuales se han ido incorporando con mayor lentitud, sobretodo los deportes de combate.

    Específicamente en este tipo de deportes se desconoce la existencia de alguna aplicación de minería de datos en función del estudio de contrarios que haya finalizado en un sistema experto u otro similar, dado que las investigaciones efectuadas en tal sentido han estado basadas mayoritariamente en análisis estadísticos descriptivos y de correlación bivariada, sin explotar las técnicas de estadística multivariada avanzada que caracterizan la minería de datos y que pudieran, a partir de datos obtenidos mediante observaciones sistemáticas al comportamiento técnico-táctico en competencias, generar modelos matemáticos predictivos, y sobre estos, aplicaciones de Inteligencia Artificial que apoyarían el proceso de preparación táctica.

Conclusiones

    A modo de conclusiones se puede expresar que:

  • La minería de datos, tanto en el deporte como en las demás ramas del saber, deviene en herramienta insoslayable para la investigación-desarrollo-innovación, por lo que su empleo continuará mostrando una tendencia creciente, siendo posible prever su inminente y necesaria incursión en el estudio de contrarios en los deportes de combate.

Bibliografía

  • Bhandari, I. y Col. (1997) Advanced Scout: Data Mining and Knowledge Discovery in NBA Data. Data Mining and Knowledge Discovery, Vol. 1, Nº 1, 121-125pp.

  • Calzadilla Fernández de Castro, O. y Col. (2007) Aplicación de la minería de datos al Sistema Cubano de Farmacovigilancia. En: Revista Cubana de Farmacología, V. 41, Nº 3. 

  • Febles Rodríguez, J. y González Pérez, A. (2002) Aplicación de la minería de datos en la bioinformática. ACIMED, V.10, Nº 2.

  • Lewis, Michael (2003) Moneyball: The Art of Winning an Unfair Game. USA, W. W. Norton & Company.

  • Miño Herrera, N, y Cols. (2010) Uso de la minería de datos para incorporar al Sistema de Estudio de Contrarios una Herramienta Inteligente para la Toma de Decisiones. VIII Congreso Internacional de Informática en la Salud.

  • Sang Jun Lee, K. (2001) A review of data mining techniques. Industrial Management & Data Systems, Vol. 101, Nº 1, 41-46pp.

  • Solieman, O. (2006) Data Mining in Sports: A Research Overview. Disponible en: http://ai.arizona.edu/mis480/syllabus/6_osama-dm_in_sports.pdf.

  • Stewart, J. (2002) Cálculo, Trascendentes Tempranas. 4 ed. México, Editorial. Thomson.

  • Szpiro, G. (2010) A Search for Hidden Relationships: Data Mining with Genetic Algorithms. Computational Economics, Vol. 10, N. 3, 267-277pp.

Otros artículos sobre Información y documentación

  www.efdeportes.com/
Búsqueda personalizada

EFDeportes.com, Revista Digital · Año 16 · N° 165 | Buenos Aires, Febrero de 2012
© 1997-2012 Derechos reservados