Soutenance de thèse de MEUNIER Baptiste


Titre de thèse

L'apport des données haute-fréquence et techniques de machine learning dans l'analyse économique

Contributions of high-frequency data and data science techniques to economic analysis

Date

27 September 2024 à 14h30

Adresse

Maison de l'Economie et de la Gestion d'Aix-en-Provence 424 chemin du Viaduc 13080 Aix-en-Provence, Salle Carine NOURRY

Ecole doctorale

Sciences Economiques et de Gestion d'Aix-Marseille

Specialité

Sciences Economiques - Aix-Marseille

Etablissement

Aix-Marseille Université

Mots clés

Données haute fréquence,Science des données,Prévision,Temps réel,

Keywords

Nowcasting,Machine learning,Forecasting,High frequency,Data science,

Jury

Jury de thèse
Qualité Nom Etablissement
Professeur des universités M. LAURENT Sébastien Aix Marseille Université
Professeur des universités M. FLACHAIRE Emmanuel Aix-Marseille Université
Maître de conférences M. GALLIC Ewen Aix-Marseille School of Economics
Professeur associé M. BRICONGNE Jean-Charles Paris I Panthéon-Sorbonne University
Professeure des universités Mme MIGNON Valerie Universite Paris X
Professeure des universités Mme DUMITRESCU Elena Université Paris-Panthéon-Assas

Résumé de la thèse

La pandémie de Covid-19 a mis en avant le besoin d'une analyse rapide du cycle économique. Cette thèse tente d'y répondre en explorant le potentiel des données à haute fréquence dans l'analyse et la prévision économique. Le premier chapitre utilise de telles données pour la prévision du PIB réel mondial. Il utilise 1000 indicateurs mensuels et hebdomadaires, dans un modèle à facteurs à mélange de fréquences (FA-MIDAS) combiné à une présélection de variables. Il démontre qu'intégrer des données à haute fréquence améliore la précision du modèle de manière significative pendant les périodes de crise (2008-09 et Covid-19) où la rapidité de publication est importante. En temps normal cependant, l'apport des données haute fréquence semble de second ordre. Le deuxième chapitre récupère les données des sites immobiliers sur le Web pour construire un ensemble de données qui offre des indications granulaires et en temps réel sur le marché immobilier au Royaume-Uni. Cette méthode permet d'analyser le comportement des vendeurs, les fluctuations de prix, et les marges de négociation des acheteurs. Il explore l'impact de la pandémie sur le marché immobilier du Royaume-Uni, révélant un gel du marché et une approche "wait-and-see" de la part des vendeurs, tout en montrant les disparités régionales, en particulier entre Londres et d'autres régions rurales. Le troisième chapitre se penche sur l'utilisation innovante des données satellitaires pour suivre la production industrielle pendant la crise de la Covid-19. Il se concentre sur le niveau de dioxyde d'azote (NO2), un polluant principalement émis par l'activité industrielle. Il démontre comment les données NO2 dérivées des satellites, ajustées des facteurs météorologiques via l'apprentissage automatique, peuvent améliorer de manière significative la prévision de la production industrielle. Cette approche est particulièrement utile pendant la crise, fournissant une estimation de la production industrielle avec plus de rapidité et de granularité que les indicateurs traditionnels. Ces chapitres suggèrent collectivement une transition vers l'intégration de diverses sources de données dans l'analyse économique. Cela contribue non seulement à la littérature économique mais a aussi des implications sur la prise de décision en politique économique dans un monde de plus en plus riche en données.


Thesis resume

In the wake of the Covid-19 pandemic, the need for timely and accurate economic insights has never been more evident. This thesis explores the potential of high-frequency and alternative data sources in economic analysis and forecasting. The first chapter applies high-frequency data to nowcasting of world real GDP growth. It uses a large dataset of 1,000 monthly and weekly series, analysed through a Factor-Augmented Mixed Data Sampling (FA-MIDAS) model augmented with pre-selection. Empirical evidence shows that incorporating high-frequency data significantly improves forecasting performances during crisis periods (GFC and Covid) where timeliness is key. In normal times however, when economic conditions remain broadly stable, high-frequency data might be of second order. The policy application of this chapter offers an alternative nowcast to institutional projections (IMF, OECD) which often become outdated in rapidly evolving scenarios. The second chapter uses web-scraping of real estate websites to construct a dataset that offers real-time and granular insights on the UK real-estate market. This method allows for the analysis of sellers' behaviour, price fluctuations, and buyers' negotiation margins. It explores the impact of the pandemic on housing dynamics in the UK, revealing a market freeze and a 'wait-and-see' approach from sellers, while also highlighting regional disparities in price trends, especially between London and rural areas. The third chapter delves into the innovative use of satellite data to track industrial production during the Covid-19 crisis. It focuses on nitrogen dioxide (NO2) levels, a pollutant primarily emitted by industrial activity, as an indicator. The study showcases how satellite derived NO2 data, adjusted for meteorological factors using machine learning techniques, can enhance the nowcasting of industrial production. This approach is especially potent during crisis, providing insights with greater timeliness and granularity than traditional indicators. These chapters collectively underscore the shift towards integrating diverse data sources in economic analysis, highlighting benefits and challenges of this approach. It not only contributes to the academic literature but also has practical implications for policy formulation and economic decision-making in an increasingly data-driven world.