Ecole Doctorale
Sciences du Mouvement Humain
Spécialité
Sciences du Mouvement Humain - MPL
Etablissement
Aix-Marseille Université
Mots Clés
Modélisation,charge d'entrainement,fitness-fatigue,apprentissage automatique,performance athlétique,
Keywords
Modelling,training loads,training fitness-fatigue,machine-learning,athletic performance,
Titre de thèse
Modélisation des réponses aux charges dentraînement pour guider la performance sportive.
Modelling responses to training loads to lead performance in sports
Date
Thursday 9 December 2021 à 14:00
Adresse
UFR STAPS
700 Avenue du Pic St-Loup
34070 Montpellier Amphitheatre
Jury
Directeur de these |
M. Stéphane PERREY |
Université de Montpellier |
Rapporteur |
M. Pierre DRUILHET |
Université Clermont Auvergne |
Rapporteur |
M. Thierry BUSSO |
Université Jean Monnet |
CoDirecteur de these |
M. Robin CANDAU |
Université de Montpellier |
Examinateur |
M. Christophe LEY |
Université du Luxembourg |
Examinateur |
M. Anne LAURENT |
Université de Montpellier |
Examinateur |
M. Jacques PRIOUX |
ENS Rennes |
Résumé de la thèse
Les premiers modèles des effets de lentrainement sur la performance athlétique sont connus sous le nom de modèles "Fitness-Fatigue" (FFM). Un inconvénient majeur des FFMs réside dans le fait quils ne sont constitués que dune seule donnée dentrée, bien que la performance athlétique soit multifactorielle. Dès lors, des approches multivariées propres aux statistiques et à lapprentissage automatique ont été proposées pour différentes applications sportives.
La quantification de la charge dentraînement (CE) pour lentraînement en résis- tance constitue une problématique de recherche à part entière. Dans une première étude, nous avons proposé une nouvelle méthode de quantification de la CE en accord avec des réponses physiologiques multiples à leffort. Après avoir modélisé les profils couple-vitesse chez les participants, nous avons évalué des réponses phy- siologiques lors de 3 sessions deffort en résistance à intensités variées et de volume égal. Les hautes intensités ont entrainé une fatigue musculaire plus importante caractérisée par des altérations neuromusculaires. A linverse, la consommation doxygène ainsi que les modifications métaboliques étaient supérieures lors defforts de plus faible intensité, indiquant des contributions énergétiques différentes. Ainsi, nous avons proposé un indice de CE basé sur les altérations neuromusculaires obser- vées à leffort. Pondérer exponentiellement la CE par une constante de décroissance du taux daugmentation de la force a montré de plus grandes corrélations avec les réponses physiologiques étudiées. Par ailleurs, linformation compressée de données multivariées dans une seule composante suite à une analyse en composantes principales pourrait représenter un indice de CE.
Dans la deuxième étude, nous avons proposé une méthodologie de modélisation basée sur la généralisation des modèles. Nous avons comparé un modèle dose- réponse à des procédures de régularisation et modèles dapprentissage automatique multivariés chez des patineurs élites. Les modèles de régularisation ont montré de meilleures performances en termes de généralisation et de précision. De plus, des modèles construits sur lensemble du groupe plutôt que par athlète apparaissaient plus pertinents dans un contexte déchantillons de petite taille. Enfin, des approches en apprentissage automatique telles que les méthodes dapprentissage ensemblistes pourraient améliorer le pouvoir prédictif des FFMs.
Dans la troisième étude, nous avons modélisé les profils accélération-vitesse à partir des mesures de systèmes de localisation par satellite (GPS), puis avons tenté de prédire les coefficients de la relation accélération-vitesse. Tout dabord, des modèles de prévision de séries chronologiques ont constitué une base de modéli- sation. Nous les avons par la suite comparés à une régression linéaire régularisée et un réseau de neurones récurrents utilisant des variables propres au GPS. Enfin, nous avons extrait des variables directement à partir des données GPS brutes pour effectuer la tâche de prédiction. Aucune différence significative na été observée entre les modèles en termes de précision. Étant donné le caractère multifactoriel de la performance athlétique, les performances prédictives étaient acceptables. Lutilisation de données extraites des domaines temporels et fréquentiels à partir des signaux bruts a montré des performances comparables aux autres modèles. Les données brutes semblent donc avoir un intérêt et devraient être analysées pour des problématiques relatives à la performance athlétique et à la survenue de blessure.
Enfin, nous avons développé un système de suivi de lentrainement pour des coureurs de fond. Lapplication propose un module de suivi de lentrainement et un modèle prédictif basé sur une modélisation physiologique de la performance en course à pied. Un second développement a été réalisé sous la solution SAP analytics cloud, produisant des rapports automatisés et un suivi de joueurs dune équipe de Rugby.
Thesis resume
The first models of training effects on athletic performance emerged with the work of Banister and Calvert through the so-called Fitness-Fatigue model (FFM).
One major drawback of FFMs is that the features stem from a single source of data. That is not in line with the existing consensus about a multifactorial aspect of athletic performance. Hence, multivariate modelling approaches from statistics and machine-learning (ML) emerged.
A research issue arises from the quantification of training Loads (TL) in resistance training (RT) which lack of physiological evidence.
In the first study, we provided a new method of TL quantification in RT based on physiological observations. To achieve that, we initially modelled the torque-velocity profiles of fifteen participants during an isokinetic leg extension task and assessed a set of physiological responses to various resistance exercises intensities.
Each session was volume-equated according to the formulation of volume load (i.e. the product of the number of repetitions and the relative intensity).
Higher led to greater muscular fatigue described by neuromuscular impairments. Conversely, systemic and local pulmonary responses (measured through oxygen uptake) and metabolic changes (according to blood lactate concentrations) were more significant at low intensities, suggesting different contributions of metabolic pathways.
From these results, we provided a new index of TL based on the neuromuscular impairments observed at exercise. We showed that to exponentially weight TL by the average rate decay of force development rate yielded better correlations with any of the significant physiological responses to exercise.
In addition, information compressed within a principal component could be a valuable TL index.
In the second study, we provided a robust modelling methodology that relies on model generalisation. Using data from elite speed skaters, we compared a dose-response model to regularisation methods and machine-learning models.
Regularisation procedures provided the greatest performances in both generalisation and accuracy. Also, we highlighted the pertinence of computing one model over the group of athletes instead of a model per athlete in a context of a small sample size.
Finally, ML approaches could be a way of improving FFMs through ensemble learning methods.
In the third study, we modelled acceleration-velocity directly from global positioning system (GPS) measurements and attempted to predict the coefficients of the relationship between acceleration and velocity.
First, a baseline model was defined by time-series forecasting using game data only. Then, we proceeded to multivariate modelling using commercial features. A regularised linear regression and a long short term memory neural network were compared.
Finally, we extracted features directly from raw GPS data and compared these features to the commercial ones for prediction purposes.
The results showed only slight differences between model accuracy, and no models significantly outperformed the baseline in the prediction task.
Given the multi-factorial nature of athletic performance, using only GPS data for predicting such athletic performance criterion provided an acceptable accuracy.
Using time-domain and frequency-domain features extracted from raw data led to similar performances compared to the commercial ones, despite being evidence-based. It suggests that raw data should be considered for future athletic performance and injury occurrence analysis.
Finally, we developed an athlete management system for long-distance runners. This application provided an athlete monitoring module and a predictive module based on a physiological model of running performance.
A second development was realised under the SAP analytics cloud solution. Team management and automated dashboards were provided herein, in close collaboration with a professional Rugby team.