Tous les étudiants doivent effectuer un stage de recherche appliquée. Le programme Fin-ML FONCER aide les étudiants à trouver des stages grâce à son réseau de professionnels et à son accès aux institutions financières. Ils sont également encouragés à trouver leurs stages de leurs propres initiatives ou avec l'aide de leur superviseur, sous réserve de l'approbation du comité des stages de Fin-ML. A la fin du stage, l'étudiant doit présenter un rapport résumant son travail, et être disponible pour présenter devant la communauté FONCER (les données sensibles et les informations confidentielles seront respectées) :

  • Un rapport résumant les résultats de la recherche
  • Une conférence basée sur les résultats de la recherche
  • Un article destiné à être soumis à un journal
  • Un modèle de code transféré sur papier

Utilisation de GPT pour automatiser la production de bulletins d'information financière

Date : 08 décembre 2023

Finliti wants to use artificial intelligence to optimize its business operations. One task they want to optimize is the research, writing and editing of a newsletter that is sent out to the company's mailing list every week. Manually writing this letter on average, according to the writer's experience, takes about 5 hours.

Finliti wanted to investigate to what extent using code to automatically generate the newsletter would reduce the time necessary to produce a newsletter of a similar level of quality. The project to determine this consisted of writing the code, testing it out in practice, and revising it to determine the final improvement over manual writing.

Overall, the amount of time needed dropped by about one hour. One suggested further step to reduce the revision time could be to have the code use the complete text from fewer articles if it can be upgraded with internet access.

Conférence de Gavin OROK, actuellement étudiant à la maitrise en Finance quantitative à l'Université Waterloo. Il a obtenu son Baccalauréat en Mathématiques financières de cette même université. Pour son stage de recherche collaborative, il a travaillé au sein de la startup Finliti, basée à Toronto, qui a pour mission d'enseigner aux jeunes professionnels comment investir au-delà d'une stratégie passive de fonds indiciels. Il également bénéficié d'une bourse Fin-ML CREATE sous la supervision de la professeure Christiane Lemieux.

Classification par rang - Une nouvelle méthode de validation des données déséquilibrées

Date : 25 novembre 2022

Most of the commonly used confusion matrix-based classification performance metrics, such as f1_score, MCC, PRC and lift curve, are sensitive to the class imbalance. To address this problem, we propose a novel classifier evaluation method, called classifier rank, which eliminates the effect of class imbalance by providing the rank of the classifier in the space of all possible classifiers.

To rank a classifier, we find the distribution of performance metrics conditional on arbitrary imbalance rate. However, some metrics like PRC and lift curve are functions of a large sequence of confusion matrices whose joint distribution is difficult to estimate.

Hence, we propose a discrete hidden Markov model and a continuous directed binary tree model to effectively represent this large-scale joint distribution. As a result, we can estimate the classifier rank using graphical inference algorithms, such as Variable Elimination and Monte-Carlo algorithm.

Conférence de Ningsheng ZHAO, candidat au doctorat en génie de l'Information et des systèmes à l'Université Concordia. Ningsheng a obtenu son diplôme de maîtrise en Statistiques à l'Université de Waterloo. Ses intérêts de recherche sont l'apprentissage automatique et la Science des données. Ses recherches actuelles portent sur les techniques de diagnostic et d'explication des modèles d'apprentissage automatique et leurs applications dans le domaine des affaires. Il s'agit d'une recherche conjointe menée avec les professeurs Jia Yuan Yu et Dr Krzysztof Dzieciolowski et soutenue par des programmes tel que MITACS, DAESYS, Fin-ML et CUPFA.

Optimisation des offres en fonction du risque pour les annonces en ligne.

Date : 04 novembre 2022

This research focuses on the bid optimization problem in the real-time bidding setting for online display advertisements. We proposed risk-neutral and risk-averse models that maximize the expected profit for the advertiser by exploiting historical data to design an upfront bidding policy, mapping the type of advertisement opportunity to a bid price and accounting for the risk of violating the budget constraint during a given period of time. And, we present the numerical results from experiments, which demonstrate that our risk-averse method can effectively control the risk of overspending the budget while achieving a competitive level of profit compared with the risk-neutral model and a state-of-the-art data-driven risk-aware bidding approach.

Conférence de Rui FAN, diplômée en maitrise en Sciences de données et Analyse d’affaires de HEC Montréal en collaboration avec le GERAD. Rui est actuellement ingénieure en données et intelligence artificielle à la Banque Royale du Canada. Ses domaines de recherche incluent l'optimisation et l'apprentissage automatique. Elle s'intéresse particulièrement à l'optimisation consciente du risque, à l'apprentissage automatique intégré à la recherche opérationnelle, et à ses applications dans les secteurs de la finance et du commerce électronique. Elle a également bénéficié d'une bourse Fin-ML CREATE sous la supervision du professeur Érick Delage.

Prévoir le pire : Prévision des pics DART d'électricité

Date : 16 septembre 2022

Statistical learning models are proposed for the prediction of the probability of a spike in the electricity DART (day-ahead minus real-time price) spread. Assessing the likelihood of DART spikes is of paramount importance for virtual bidders, among others. The model's performance is evaluated on historical data for the Long Island zone of the New York Independent System Operator (NYISO). A tailored feature set encompassing novel engineered features is designed. Such a set of features makes it possible to achieve excellent predictive performance and discriminatory power.

Results are shown to be robust to the choice of the predictive algorithm. Lastly, the benefits of forecasting the spikes are illustrated through a trading exercise, confirming that trading strategies employing the model predicted probabilities as a signal generate consistent profits.

Conférence de Rémi GALARNEAU-VINCENT, candidat au doctorat en Ingénierie financière à HEC Montréal, sous la supervision de la professeure Geneviève Gauthier. Il a découvert le marché de l'électricité lors d'un travail de recherche avec la société Plant-E corp. C'est un passionné d'apprentissage automatique.

Générer et prédire des séries temporelles multivariables

Date : 11 mars 2022

Time series forecasting is to try to predict future realizations based on past observations. Those predictions can be precise or probabilistic depending on the model. Recent development in machine learning has accelerated the quantity of interesting models. The model selection is very much dependent of the use case and needs a thorough investigation. It is however harder to compare different models to measure their prediction quality, robustness, computational performance and data requirements. We will present a package written in Python to measure the performance of multiple models. For that purpose, we will focus on the simulation of time series to use as benchmarks.

Conférence de Francis HUOT-CHANTAL, candidat au doctorat en Mathématiques appliquées à l’Université de Montréal, sous la supervision du professeur Fabian Bastin. Le sujet de sa recherche porte sur la tenue de marché à haute fréquence. Cependant, il aimerait approfondir la preuve théorique de la convergence. Comme la partie la plus importante de sa thèse est consacrée à la mise en application, il travaille principalement avec les langages de programmation Julia et Python.

Évaluation de crédits syndiqués en présence d'un avenant financier

Date : 11 Février 2022

Nous évaluons l'impact de l'inclusion d'une clause de sécurité dans les contrats de prêts syndiqués. Nous proposons un modèle de jeu dynamique stochastique des ajustements des contrats de prêts syndiqués en présence de la clause. Le modèle tient compte du droit du prêteur de punir ou de tolérer toute violation de la clause, et de la flexibilité de l'emprunteur dans l'ajustement de sa stratégie d'investissement et de prise de risque. Nos expériences numériques montrent que, si une clause de sécurité améliore la valeur du prêt dans la plupart des États, elle peut avoir un effet négatif lorsque le risque de faillite devient important. Une étude supplémentaire montre que le prêteur peut tolérer de manière optimale un certain défaut technique pour éviter cet effet négatif. Nous constatons également que la valeur de la clause diminue lorsque la solvabilité de l'emprunteur s'améliore.

Conférence de Tiguéné NABASSAGA, candidat au doctorat en Ingénierie financière à HEC Montréal, sous la supervision de la professeure Michèle Breton. Tiguéné est actuellement gestionnaire au sein d'Ernst & Young Global Consulting Services.

Détection automatique d'anomalies dans le marché des produits dérivés à haute-fréquence par apprentissage profond non-supervisé

Date : 3 Décembre 2021

The recent rise in the interest of market participants towards financial derivatives directly lead to an augmentation in the quantity of high-frequency data processed continually by all exchanges. Regulators, who constantly monitor markets to unveil potential infractions, still perform their investigations manually with the help of deterministic rule-based algorithms. Thus, this notable growth in data generation poses a heightened risk of fraudulent orders going unnoticed.
I will present an ongoing research work that aims to solve the problem of algorithmic fraud detection in the derivatives market. This work, in collaboration with TMX, relies on the vast literature of anomaly detection to locate potential fraudulent patterns in the limit order books’ time series. Because of the complex nature of that data and the very low amount of real fraud cases, a new framework based on deep unsupervised learning algorithms specifically designed for high-frequency time series is proposed.

Conférence de Cédric POUTRÉ, candidat au doctorat en Mathématiques financières à l'Université de Montréal, sous la supervision du Professeur Manuel Morales. Il s'intéresse aux diverses applications de l’apprentissage machine dans le trading à haute fréquence et la microstructure des marchés.

Description des états du prix de l'énergie sur le marché NYISO à l'aide du modèle à chaîne de Markov cachée d'entrée-sortie

Date : 26 Novembre 2021

The energy market in New York is centralized and managed by an independent system operator called NYISO. The price of energy on this market is determined by an auction mechanism. The Analysis of this price reveals that it is very volatile for several reasons (uncertain and inelastic demand, dynamic changes in the behavior of participants, etc.) that can be represented by models indexed by Markov chains.
In this work, an Input-Output HMM models is used to predict the price of energy and describe its hidden states. This model is well known for its ability to predict conditional price density. In order to be able to better describe the states (especially if they are numerous), a parsimonious parameterization is used.

Conférence d'Ismaël ASSANI, candidat au doctorat en statistique à l'Université de Montréal, sous la supervision du professeur Maciej Augustyniak. Ismaël s'intéresse à la modélisation des séries financières, en particulier aux modèles indexés par des chaînes de Markov cachées (discrètes et continues), à la couverture et à l'évaluation des produits dérivés ainsi qu'à l'application des méthodes d'apprentissage automatique en finance.

Utilisation de l'apprentissage par renforcement pour maximiser la rentabilité des clients et la valeur de la clientèle dans les institutions financières

Date : 19 Novembre 2021

Customer Lifetime Value, CLV, is a popular measure to understand the future profitability of customers to allocate resources in more efficient ways to keep the company alive during difficult economic situations.
We use Machine Learning tools to predict the expected revenue from each customer during one year of his/her relationship with the institution as the CLV of the customer. The approach is implemented on two datasets from two international financial institutions. Different feature engineering techniques were applied to improve the prediction power of the model. We used two stage or three stage prediction models.
In the second phase, we train a reinforcement learning algorithm based on the history of marketing activities and the CLV as the state of customers to determine the optimum marketing action for customers in each state to maximize their profitability.

Conférence de Meisam SOLTANI. Après une formation en Génie électrique et dans l'industrie automobile, Meisam est passé à l’univers de la Science des données et de l'analytique. Il a obtenu un diplôme en Sciences de la gestion à l'Université de Waterloo en 2014. Tout en poursuivant son doctorat en Analyse de gestion à l'Université Queens, sous la supervision du professeur Mikhail Nediak, Meisam a participé à de nombreux projets en lien avec la Science des données et d'analytique à la Banque Scotia.

Amélioration de la prédiction des notations à l'aide de données textuelles

Date : 22 Octobre 2021

Over recent years, Natural Language processing (NLP) is widely used in many areas including finance and economics. Over the last decades, some influential papers have investigated whether negative words in the press can affect significantly affect individual stocks and aggregate market (Tetlock, 2007). They provide strong empirical evidence between their dictionary and 10K/10Q filing and return, trading volume, unexpected earning, and fraud.

The aim of this research is to fill gap and provide a framework that assess the credit rating of the firm more broadly using natural language processing from firm fillings. The proposed model can be used to assess the discriminating power of the identified variables that have been shown to be related to the rating.

Conférence d'Ernest Tafolong, diplômé d'une maitrise en Sciences de données à HEC Montréal, sous la supervision du Professeur Erik Delage. Ernest est actuellement directeur du département d'ingénierie financière d'une société de crédit alternatif établie au Canada, où il dirige le développement de tous les modèles d'apprentissage automatique pour les prêts automobiles et personnels. Son expérience antérieure comprend la quantification des risques de marché à la Banque Nationale du Canada, il a également été conseiller en ingénierie financière chez Desjardins où il a conçu et mis en œuvre des modèles quantitatifs pour les stratégies d'investissement et la gestion des risques. En outre, il a fourni des conseils quantitatifs pour la gestion du risque de modèle dans de grandes banques françaises. Il a également obtenu une maîtrise en ingénierie financière à l'Université Laval en 2011.

Détection de la fraude sur le marché des produits dérivés grâce au Traitement du langage naturel (NLP)

Date : 17 juin 2021

With increasing activities in the financial derivatives market, exchange regulators are seeking to build smarter market surveillance systems to detect potential frauds. Current systems are often based on rules capturing known suspicious patterns reflected in the structured market data, while not having the ability to process information conveyed by unstructured textual data such as business news, which, however, can have crucial real-time impact on the market. Thus, it is of great interest to leverage NLP to extract analytics from textual data, so that the surveillance system could assess trading behaviors more accurately due to the added awareness of the business context.
In this talk, I will introduce a work in progress that develops a financial events analysis NLP pipeline that extracts important events from financial news then analyzes their characteristics, and a framework to leverage those analytics to help detect financial frauds, especially illegal insider trading, in the derivatives market.

Conférence de Pan LIU, candidat au doctorat en Sciences de données à HEC Montréal, sous la supervision du professeur Gilles Caporossi. Son intérêt de recherche est de développer des modèles de traitement du langage naturel et d'apprentissage automatique pour résoudre des problèmes en finance.

Fixation du prix des options par le biais des équations différentielles stochastiques neurales et de la théorie de l'évaluation de Martingale

Date : 28 Mai 2021

This research investigates pricing financial options based on the traditional martingale theory of arbitrage pricing combined with neural SDEs. We treat neural SDEs as universal Itô process approximators. In this way we can lift all assumptions on the form of the underlying price process, and compute theoretical option prices numerically based on empirical data.
Along the way we propose a new variation to train neural SDEs by implementing the Wassterstein distance metric as a loss function. While similar to the GAN formulation, this technique does not need a discriminator and works will in the experiments, albeit limited in scope. Furthermore, it is conjectured that the error of the option price implied by the learnt model can be bounded by the very Wasserstein distance metric that was used to fit the empirical data.

Conférence de Timothy DeLISE, candidat au doctorat en Mathématiques à l'Université de Montréal, sous la supervision du professeur Manuel Morales. Ses intérêts de recherche sont les mathématiques, l’apprentissage automatique et le développement de logiciels.

Méthodes complexes pour la fixation des prix et la protection des produits financiers dérivés

Date : 14 Mai 2021

I will present a reinforcement learning approach for the problem of optimally hedging financial derivatives. I will start by giving an overview of the hedging problem with classical approaches considered in the literature.
Afterwards, I will present the approach called deep hedging which I extensively studied in my PhD research thesis. This class of algorithms represents trading policies by neural networks. In other words, asset positions used for hedging are obtained as the output vectors of neural networks. Various numerical experimentations of this approach will be presented for pricing and hedging different financial derivatives.

Conférence d'Alexandre CARBONNEAU qui a obtenu un doctorat en Finance mathématique à l’Université Concordia sous la direction du Professeur Frédéric Godin. Il est titulaire d’un Baccalauréat en Mathématique avec une spécialisation en actuariat de l’Université de Montréal, ainsi qu’une Maitrise en finance mathématique et computationnelle de la même institution.

Analyse comparative des librairies de prédiction de séries chronologiques

Date : 7 Mai 2021

Les différents modèles permettant l'analyse et la prédiction de séries chronologiques sous le langage de programmation Python sont listés et catégorisés. Ensuite, des données sur sept (7) contrats à terme différents sont obtenues et nettoyées afin d'être utilisées lors de l'analyse comparative. Une division en 20 échantillons d'entraînement et de test est réalisée dans le but d'évaluer l'erreur de prédiction. Une sélection restreinte de librairies adaptées au présent cas d'utilisation est effectuée. Le modèle ARIMA émerge comme étant le meilleur modèle en termes du MAE vis-à-vis les autres types de modèles pour la série S2.
Dans le but d'explorer plus en détails les modèles d'apprentissage profond, ceux-ci sont revisités. L'architecture du réseau de neurones récurrents à mémoire court et long terme (en anglais LSTM) est retenue comme étant la plus performante.
Enfin, ces résultats sont discutés puis des pistes d'amélioration sont présentées.

Conférence de Samuel TREMBLAY, conseiller en ingénierie des données au Mouvement Desjardins, où il accompagne de nombreux secteurs d’affaires dans la valorisation de leurs mégadonnées. Samuel est titulaire d’un Baccalauréat en Génie aérospatiale de l'École Polytechnique de l'Université de Montréal et d’une Maîtrise en Intelligence d’affaires à HEC Montréal, sous la co-supervision des professeurs Jean-Francois Plante et Gregory Vial.

Prévision du prix des obligations basée sur un filtre RNN et une régularisation sans arbitrage

Date : 23 Avril 2021

We review the class of HJM forward rate model and the dynamic term structure model in forecasting the yield curves and the prices of the coupon bonds by filter-based recurrent neural networks.
We propose model in the Kalman filter and the particle filter with the arbitrage-free restriction as regularization using the deep neural networks. We mainly build on LSTM to extract the useful information from historical time series of daily closed bond data and other type of networks to process the sequential errors for yield curve modeling and calibrating.
The purpose of the research is mainly to study the effect of arbitrage penalty on different forecasting horizons. We use data from U.S. Treasuries and coupon bonds of twelve corporate issuers. We provide analysis of the prediction error, error distribution, the average excess return, and results of out-of-sample test to show the efficiency and performance of our models.

Conférence de Xiang GAO, titulaire d'un doctorat en Mathématiques appliquées à l’Université Concordia sous la supervision du professeur Cody Hyndman. Ses intérêts de recherche sont: les mathématiques financières et l'apprentissage automatique.

Recours à l'apprentissage profond par renforcement pour la gestion de portefeuilles basée sur un modèle WaveNet

Date : 16 Avril 2021

Portfolio management is a challenging task in its nature because of the abundance of factors that should be simultaneously considered: the investors' risk preferences and constraints, the investment environments and their limitations, and complicated features that affect the future price movements.
In this study, we propose a model based on actor-only reinforcement learning that takes all of these factors into account and provides a significant improvement in the portfolio performance compared to the most recent deep reinforcement learning models. In particular, we build on WaveNet, a model that was originally proposed for generating audio waveforms, to extract the useful information from historical time series of assets for portfolio management. Contrary to the similar previous models, we show that the performance of our approach is not affected by how the assets are permuted when fed into the model, and this could make the output of the model more reliable by practitioners.

Conférence de Saeed MARZBAN. Sous la supervision du professeur Érick Delage, Saeed termine un doctorat en Ingénierie financière à HEC Montréal avec une concentration sur les matières quantitatives tels que les probabilités, les statistiques, le calcul stochastique, l'analyse numérique et l'apprentissage automatique. En particulier, sa thèse porte sur l'application de différents types d'apprentissage par renforcement de gradient de politique à l'analyse de séries chronologiques pour l'évaluation des options, la couverture et la gestion de portefeuilles (en collaboration avec une société d'investissement). Il possède aussi des compétences et une expérience approfondie en Programmation dans divers langages et cadres orientés objet, ainsi que des expériences industrielles et de gestion.

Développement d'un système de recommandations à l'aide de réseaux de neurones artificiels

Date : 12 Février 2021

Recommender systems are now a well-known technology used by many e-commerce platforms. Those platforms often have access to diverse sources of data, and traditional recommender systems might not accurately leverage all the available information.
This conference introduces the usage of Graph Neural Networks (GNNs) for personalized recommendation in a large-scale and heterogeneous data setting. We will observe how popular GNN models can be used for the task and what enhancements worked best for Decathlon, notably concerning how to handle evolving and seasonal customers’ preferences.

Conférence de

Couverture des options sur panier avec l'apprentissage profond

Date : 29 Janvier 2021

This conference introduces an effective model-free hedging strategy for a Basket Option using its component assets. By using Principal Components Analysis, the cost of trading can be reduced significantly and mitigate the effect of trading with non-liquid assets. Through numerical analysis, we will observe that an LSTM architecture for solving such a problem is very robust to compute an optimal solution. The model will also express the capacity of the neural network to fit an hedging strategy based on a custom risk function of an agent.

Conférence de