Lecturas: Educación Física y Deportes, Revista Digital


Uma caminhada metodológica na rota das estatísticas e da análise do jogo de Basquetebol Jaime Sampaio e Manuel Janeira
http://www.efdeportes.com/ Revista Digital - Buenos Aires - Año 7 - N° 39 - Agosto de 2001

2 / 3

    Segundo este "novo conceito"² considera-se a conquista do ressalto ofensivo não como uma nova PB mas como um "reavivar" da PB anterior. Desta forma, poderemos constatar que no final dos jogos, as equipas em confronto, usufruíram aproximadamente do mesmo número de PB, uma vez que uma equipa não pode dispor de PB consecutivas. Este aspecto atribuiu a esta estatística uma enorme estabilidade e, consequentemente, uma enorme utilidade. De facto, se as equipas dispuseram do mesmo número de PB no jogo, naturalmente que será mais eficaz a que mais pontos converter (i.e., a equipa vencedora).
    As dificuldades encontradas na avaliação longitudinal da eficácia colectiva ficaram assim resolvidas e deste modo eliminou-se igualmente a possibilidade de uma equipa vencer um jogo com um CEO menor do que a equipa adversária. De facto e segundo este método, a eficácia resultante da conversão de pontos em função das PB disponíveis associa-se, de um modo muito mais sólido, à vitória ou à derrota nos jogos (Turcoliver, 1990, 1991). Para além disso, torna os CEO e os CED em estatísticas preciosas, do ponto de vista da avaliação da qualidade do ataque e da defesa das equipas.
    Retomando o exemplo anterior e apreciados os CEO definidos a partir deste novo conceito de PB, podemos verificar que a situação inicial se alterou, i.e., o CEO da equipa que venceu passou a ser superior ao CEO da equipa que saiu vencida.

    Para complementar este processo e no sentido de possibilitar a comparação longitudinal dos CEO e CED, Turcoliver (1990) sugere que se utilize uma medida padrão de 100PB.
    Ou seja, estes coeficientes passam a representar o número de pontos marcados (ou sofridos) em 100PB e podem ser calculados pela seguinte equação (ver Equação 3.):

Equação 3. Cálculo do coeficiente de eficácia ofensiva (e defensiva) relativizado à medida padrão de 100PB.
    A partir destas estatísticas inovadoras tem sido possível traçar caminhos de análise longitudinais e, desta forma, alargar os horizontes do conhecimento do jogo. Como exemplo, a Figura 1. expressa a variação dos pontos marcados por jogo (PMJ), das posses de bola por jogo (PBJ) e do coeficiente de eficácia ofensiva (CEO) respeitantes à fase regular da NBA das épocas entre 1975 e 1995 (Turcoliver, 1996b). Como podemos observar, o jogo tem-se tornado mais lento (decréscimo nas PB) ao longo destas épocas desportivas. No entanto e apesar das equipas converterem menos pontos por jogo, são cada vez mais eficazes (aumento no CEO).

Figura 1. Evolução da eficácia, pontos por jogo e posses de bola por jogo na NBA,
desde 1973 a 1995 (Adaptado de Turcoliver, 1996b)
    De uma forma semelhante, o estudo da variação destas estatísticas ao longo de um campeonato tem-se tornado fundamental para o conhecimento da dinâmica interna das equipas. A Figura 2. apresenta a variação do número de posses de bola de uma equipa portuguesa da LCB na época 1997-1998 (Sampaio, 1999). Na 1ª volta do campeonato, a equipa em questão jogou a um ritmo superior à média das outras equipas (75PB vs. 73PB) e venceu 80% dos jogos, enquanto que na 2ª volta jogou a um ritmo mais lento do que a média (70PB vs. 73PB) e apenas venceu 63% dos jogos.

Figura 2. Variação do número de posses de bola de uma equipa portuguesa da
Liga de Clubes de Basquetebol na época 1997-1998 (Sampaio, 1999).
    Um dos maiores problemas com que Turcoliver se debateu foi com o cálculo do número de posses de bola no jogo. Enquanto que a utilização do método mais tradicional requeria apenas o acesso a algumas estatísticas (PB=LT+(LLT/2+PDB), esta nova formulação exigia a observação directa do jogo para a contabilização do número de PB (o que tornava o processo muito lento e inviabilizava a utilização de bancos de dados já disponíveis). Face a esta dificuldade, o autor desenvolveu um conjunto de procedimentos que resultaram na seguinte equação de cálculo (ver Equação 4.):

Equação 4. Cálculo das posses de bola no jogo pela sugestão de Turcoliver (1990).
    Numa primeira fase, utiliza-se a Equação 4. para calcular as PB para cada uma das equipas (PBA e PBB). Posteriormente, considera-se o valor médio destas duas parcelas como representativo do número de PB no jogo (Turcoliver, 1990).
    O exemplo seguinte poderá ilustrar melhor estes procedimentos.

    Com esta nova perspectiva de análise surgiram outras estatísticas que, em determinadas circunstâncias, complementam a avaliação da eficácia colectiva das equipas. Turcoliver (1990) considera que as mais importantes são: (i) a percentagem de campo, (ii) a percentagem de jogo, (iii) a percentagem de lançamentos de campo ponderada e (iv) a probabilidade de vencer o jogo.

(i) Percentagem de campo (%C)
    A percentagem de campo é uma estatística da qualidade do ataque. É definida como a percentagem de posses de bola em que a equipa converteu pelo menos um ponto. O cálculo desta estatística pode ser realizado através da Equação 5.

Equação 5. Cálculo da percentagem de campo.
    O único argumento relativo à validade da formula é apresentado por Turcoliver (1990a) nos seguintes termos: "It is sometimes inaccurate, especially with small data samples and it wasn't logically derived as a good formula should be…But, in fact, the formula for floor percentage is very useful…It is also simple to calculate and it is a good first indicator of offensive quality".
    De facto, o único problema que está associado à %C é que esta não varia em função das estatísticas dos lances-livres e, como tal, assume um número normal de ocorrências por jogo (Turcoliver, 1990). Todavia, a sua utilização é bastante frequente.
(ii) Percentagem de jogo (%J)
    Esta estatística é definida como a percentagem de posses de bola em que a equipa converteu pontos através de lançamentos de campo. O cálculo desta estatística pode ser realizado através da Equação 6.

Equação 6. Cálculo da percentagem de jogo.
    Da mesma forma que a %C, a %J é uma medida da qualidade do ataque de uma equipa, na qual se retira a influência das situações em que essa mesma equipa conquistou ressaltos ofensivos.

(iii) Percentagem de lançamentos de campo ponderada (%LCP)
    Esta estatística foi construída com o propósito de equilibrar as percentagens de eficácia nos lançamentos de campo, ao atribuir uma ponderação acrescida aos lançamentos de três pontos (ver Equação 7.).

Equação 7. Cálculo da percentagem de lançamentos de campo ponderada.
(iv) Probabilidade de vencer o jogo (%V)
    Esta estatística é uma previsão da probabilidade de uma equipa vencer um jogo a partir dos CEO e CED obtidos em jogos anteriores. O seu cálculo baseia-se no facto do rácio de vitórias/derrotas de uma equipa estar relacionado com os coeficientes de eficácia ofensiva e defensiva (ver Equação 8.). Por exemplo, é natural que, no final de uma época desportiva, as equipas que venceram 60 jogos tenham conseguido diferenças entre a eficácia ofensiva e defensiva mais elevadas, relativamente às equipas que venceram 50 jogos (Turcoliver, 1990, 1991).

Equação 8. Cálculo da probabilidade de vencer o jogo.
    Originalmente desenvolvida nos trabalhos do Basebol por Bill James (para refs ver James, 1984) este conceito é denominado Pythagorean Theory (Note-se que Bill James atribui-lhe esta designação, apenas porque os expoentes atribuídos às parcelas da equação lhe fizeram recordar o Teorema de Pitágoras. O autor definiu a equação pitagoreana do seguinte modo: "The ratio between a team's wins and losses will be the same as the square of the ratio of their runs scored and allowed " (James, 1989, p.14).
    Trata-se de um método desenvolvido de uma forma empírica (James, 1989). Apesar da investigação mais actual apontar algumas criticas a estes procedimentos e apesar de já terem sido realizadas algumas alterações aos expoentes das parcelas da equação (para refs. ver Davenport, 1999), a utilidade desta estatística é unanimemente reconhecida.
    A validação da equação original foi realizada numa amostra de jogos pertencentes a 24 equipas que disputaram a Major League Baseball, durante a época de 1993-1994.
    Através destes dados foi possível identificar uma correlação bastante elevada (r=0,857 com uma linha de melhor ajustamento y=0,003x + 1,002x) entre a percentagem prevista de vitórias das equipas e a percentagem real de vitórias das equipas.
    A aplicação deste método ao Basquetebol foi estudada por Manley (1988) e Turcoliver (1991).
    Os resultados do estudo de Manley (1988) encontrados a partir de uma análise a 161 equipas da NBA (épocas 1980 a 1987), evidenciaram que o expoente mais ajustado para a equação seria 16,1.
    Por outro lado, Turcoliver (1991) ao estudar os jogos de 27 equipas da NBA na época 1990-1991, verificou que a utilização do expoente 16,5 permitiu obter uma correlação quase perfeita (r=0,99 com uma linha de melhor ajustamento y=0,06 + 0,87x) entre a percentagem de vitórias prevista e a percentagem de vitórias reais das equipas.
    A confirmar estes resultados, Sampaio (1999) identificou uma relação muito forte entre a percentagem prevista de vitórias através da equação pitagoreana de Turcoliver e a percentagem real de vitórias das equipas (ver Figura 3.). Neste estudo, foram utilizados todos os jogos da fase regular da LCB respeitantes às épocas desportivas 1997-1998 e 1998-1999.

Figura 3. Associação entre a previsão de vitórias obtida a partir da equação Pitagoreana de
Turcoliver e o número de vitórias reais das equipas nos jogos da fase regular da Liga de Clubes de Basquetebol
(Portugal), respeitante às épocas 1997-1998 e 1998-1999 (Sampaio, 1999).
    O conjunto de fundamentos e métodos desenvolvidos por Turcoliver só muito recentemente começaram a ter algum impacto no universo do Basquetebol. Tal como no estudo do Basebol, é natural que demore algum tempo até que a utilidade destas "novas estatísticas" seja reconhecida por treinadores e investigadores do Basquetebol. O titulo de um dos trabalhos mais recentes de Zaidlin (1999) não poderia ser mais esclarecedor relativamente a esta matéria: "Twenty years later, Sabermetrics still largely ignored in baseball's front offices".
    Em termos gerais, o autor expõe as principais contribuições dos Sabermetricians, sugerindo a sua utilização como ferramentas de apoio a todos os intervenientes no jogo.
    Posteriormente, aponta algumas razões que justificam a pouca aceitação destes trabalhos no universo do Basebol, centradas nas "particularidades da natureza humana" (Zaidlin, 1999):
     "…Bill James, Pete Palmer and others come along, and teach us how to analyze the game of baseball. They find little evidence to support the baseball myths. They are Galileo's, with baseball's establishment representing the church. Their conclusions challenge the very heart of the belief system...It would appear to strip the game of the human element and substitute in its place a cold, unfeeling, inhuman, "engineering" approach to the game…and who were these nerdy guys with their computers to tell US, the players, coaches, managers, and GM's that we didn't understand the game?".
    Em Portugal, as referências neste domínio são escassas. Para além do trabalho anteriormente referido (Sampaio, 1999) realçamos, pelo seu contributo original, as Teses Finais de Licenciatura de Leite (1999) e de Almeida (1999), decorrentes da reflexão conjunta dos docentes que integram os Gabinetes de Basquetebol da UTAD e da FCDEF-UP.
    O trabalho de Leite (1999), de carácter mais metodológico, centrou-se nos seguintes propósitos:

validar a equação de cálculo das posses de bola (ver Equação 2.5.) apresentada por Turcoliver (1990);

comparar os valores dos CEO e CED (medidos pelo "método tradicional" e pelo método de Turcoliver) com o desfecho final dos jogos (vitória/derrota);

medir a sensibilidade dos CEO e CED face à variação da diferença pontual dos jogos. Os resultados da validação da equação de cálculo foram apresentados em 4 etapas fundamentais que passamos a descrever (ver Quadro 1.).

Quadro 1. Resultados das etapas de validação da equação de Turcoliver (1990a) realizadas por Leite (1999).

Etapa 1
    Comparação entre os valores médios das posses de bola, medidas através da observação em vídeo, pelo método "tradicional" (PB) e pelo método de Turcoliver (PBT). Os resultados evidenciaram diferenças estatisticamente significativas entre as duas variáveis (t=32,95; p=0,000), pelo que se pôde constatar que se mediram fenómenos diferentes.
Etapa 2
    Comparação entre o valor médio das posses de bola medidas pelo método de Turcoliver (PBT) e o valor médio calculado pela equação de Turcoliver (PBF). O coeficiente de correlação intra-classe foi bastante elevado (r=0,98) pelo que se concluiu que a perda de informação, quando recorremos à equação em detrimento da observação integral do jogo, não foi significativa.
Etapa 3
    Comparação entre os valores das posses de bola calculado pela equação de Turcoliver (PBF) e o valor médio das posses de bola das duas equipas (calculados pela mesma fórmula, PBM). O coeficiente de correlação intra-classe aumentou (r2=0,99), pelo que se verificou que a utilização do valor médio para ambas as equipas foi a solução que provocou menores perdas de informação.
Etapa 4
    Comparação entre o valor médio das posses de bola medidas pelo método de Turcoliver (PBT) e o valor médio das posses de bola das duas equipas (PBM). O coeficiente de correlação intra-classe foi semelhante ao obtido na análise anterior (r=0,99), facto que confirmou a utilização das PBM como um indicador válido para medição das posses de bola.
    A comparação dos valores médios da eficácia colectiva (medida por ambos os métodos) com o desfecho final dos jogos (vitória/derrota), pretendeu determinar a sua qualidade de diferenciação (ver Quadro 2.23.). Os resultados expressaram magnitudes de diferenças (identificadas a partir dos valores de w²) superiores para os CEO e CED calculados pelo método de Turcoliver (CEOMT e CEDMT). Este facto, confirmou a maior utilidade destas estatísticas para a diferenciação da vitórias/derrotas nos jogos.

Quadro 2. Resultados da comparação dos valores médios da eficácia colectiva
(medida por ambos os métodos) e o desfecho final dos jogos (Adaptado de Leite, 1999).

    Na fase final do estudo, o autor pretendeu medir a sensibilidade dos coeficientes de eficácia face à variação da diferença pontual dos jogos (ver Quadro 3.). Em função dos valores apresentados foi possível verificar que os coeficientes produzidos pelo método de Turcoliver estão mais associados à variação das diferenças pontuais dos jogos.
Quadro 3. Resultados da associação identificada entre a diferença pontual final dos jogos e
a eficácia colectiva medida pelos dois métodos enunciados (Adaptado de Leite, 1999).

    Os resultados e as conclusões expressas neste estudo parecem confirmar alguns dos pressupostos metodológicos de análise do jogo que anteriormente apresentamos. Desta forma, o estudo de Leite (1999) preenche um vazio importante na literatura.
Por outro lado, Almeida (1999) procurou operacionalizar estes mesmos pressupostos, remetendo as questões da avaliação da eficácia colectiva das equipas para um quadro de preocupações centrado nas restantes estatísticas do jogo.
    A dúvida que se colocou neste domínio expressou-se da seguinte forma: se o ritmo de jogo "contamina" os valores dos CEO e CED, então é natural que "contamine" igualmente os valores das restantes estatísticas.
    Por exemplo, a avaliação da performance de uma equipa que converte 40 lançamentos num jogo de 80PB terá que diferir da avaliação da performance de uma equipa que converte 40 lançamentos num jogo de 70PB. No entanto, do ponto de vista das análises que habitualmente são realizadas estas diferenças têm sido desprezadas, facto compromete a interpretação mais sólida dos resultados disponíveis na literatura.
    Neste contexto, parece claro que a reformulação de todas as estatísticas do jogo por forma a analisar os seus valores relativamente à medida padrão de 100PB faz todo o sentido.
    Apesar desta questão nunca ter sido tratada na literatura do ponto de vista da sua fundamentação metodológica, Almeida (1999) apresentou-nos os primeiros resultados obtidos a partir deste novo entendimento. O autor pretendeu identificar as estatísticas que contribuíram para o desfecho final de 8 jogos do campeonato regional de cadetes masculinos da Associação de Basquetebol de Vila Real.
    As variáveis em estudo foram as seguintes:

Assistências, intercepções, faltas cometidas, roubos de bola, ressaltos defensivos e ofensivos e perdas de bola (todas as estatísticas foram relativizadas à medida padrão de 100PB);

Lançamentos de 2 pontos de dentro (IN) e de fora (EX) da área restritiva (tentados/100PB, convertidos/100PB e percentagens de eficácia), lançamentos de 3 pontos (tentados/100PB, convertidos/100PB e percentagens de eficácia), lances-livres (tentados/100PB, convertidos/100PB e percentagens de eficácia);

Percentagem de campo e de jogo.

    Os resultados foram analisados pelo recurso ao t-teste para medidas independentes e a magnitude das diferenças foi apreciada pelos valores de w². Nos resultados obtidos foram encontradas diferenças estatisticamente significativas (ver Quadro 4.) com valores médios superiores para as equipas vencedoras nas %L2C_IN (w²=0,50), %L2T_IN (w2=0,39), %L2_IN (w²=0,22), %RD (w²=0,27) e %RO (w²=0,40).

Lecturas: Educación Física y Deportes · http://www.efdeportes.com · Año 7 · Nº 39 sigue Ü