Prévoir les marchés grâce à l’IA

De façon croissante, les techniques d’IA s’implantent chez les hedge funds et opérateurs de marché. Après tout, Deepseek, la star chinoise en matière d’IA, a été développée par un fonds d’investissement quantitatif qui entendait bien utiliser le modèle pour ses propres interventions. Quel est le potentiel de cette nouvelle technique ?
Pour commencer, il faut une idée qui ne va pas forcément de soi, à savoir qu’on peut prédire, dans certaines limites, les marchés financiers. Dit de façon plus technique, qu’ils ne sont pas « efficients » dans l’usage de l’information. Si toute l’information pertinente pour expliquer les mouvements des variables financières, par exemple le prix des actions, les taux de change ou les taux d’intérêt, est mise sur la table, l’hypothèse d’efficience nous dit que des opérateurs mis en concurrence vont exploiter cette information au mieux. De sorte que le prix ne pourra bouger que si apparaît une information « nouvelle », non connue par définition des opérateurs ; si elle l’était, elle serait déjà dans le prix. Par conséquent, les actifs financiers sur un marché efficient se comportent de façon purement aléatoire et ne peuvent donc être prédits.
Or, non, les marchés financiers ne sont pas efficients, la preuve en est que les opérateurs de marché gagnent en moyenne de l’argent à y opérer, y compris sans user de moyens illégaux. Ils disparaîtraient sinon. Et sans spéculation financière, il n’y aurait pas d’intérêt à creuser l’information pour déterminer le prix des actifs financiers, ce qui à terme rendrait le marché… non efficient. Il y a donc toujours une course-poursuite pour aller vers l’efficience, tout en constatant qu’elle est constamment perturbée. On ne quitte pas une sorte de circularité du raisonnement.
Les quatre techniques de prévision
Première technique, les modèles structurels. Aidés, de préférence par la théorie économique, on construit des modèles qui décrivent les relations causales entre différentes variables économiques et financières. Par exemple, tel modèle reliera le taux de change à la balance commerciale du pays ; tel autre enrichira l’explication en y ajoutant le niveau relatif des taux d’intérêt du pays par rapport à ceux de l’étranger, etc. Le modèle théorique le plus utilisé pour la prédiction des cours boursiers est le CAPM, reliant linéairement le rendement de l’action au rendement moyen du marché boursier.
Disons-le, les modèles structurels restent avec des performances médiocres. D’abord, il ne sert à rien d’avoir un modèle, même « vrai », par exemple liant le taux de change à t+1 à la balance commerciale à t+1, tant qu’on n’est pas capable de prédire cette balance commerciale à t+1. Il faut que le modèle introduise des précurseurs, reliant par exemple la balance à t au taux de change à t+1. Et ce n’est pas facile. Le CAPM ne vaut au mieux que comme indice de sur- ou sous-évaluation d’un actif par rapport à l’ensemble du marché.
Et surtout, les modèles sont par définition instables car ils incorporent des facteurs qu’on ne sait pas prédire. Si on reprend notre modèle (supposé « vrai ») entre taux de change et balance commerciale, il deviendra faux si tout d’un coup des droits de douane sont introduits. Et le modèle lui-même crée des anticipations qui vont changer le modèle. On sait par exemple que Fort Knox n’a jamais été cambriolé parce que les forces de sécurité dissuadent tout cambrioleur. Mais, un Elon Musk à la tête de DOGE aurait tort d’inférer de l’absence de cambriolage que ces forces de sécurité sont inutiles et qu’on doit les flanquer à la porte. Car les voleurs reviendraient.
Les modèles structurels restent toutefois très utiles, parce qu’ils valident, sur l’examen du passé, des relations stables entre certaines variables et donc permettent de formuler des explications, de trouver des causes. Si jamais les droits de douane devaient désormais bouger constamment, un bon modèle permettra, une fois qu’il disposera de données rétrospectives, de formuler des jugements du type : si le droit augmente de 10 points, alors l’inflation interne augmentera de x%.
Une seconde technique nous vient des modèles autorégressifs. On fait ici le constat qu’en absence d’une efficience parfaite, la variable à prédire, le taux d’intérêt par exemple, n’est pas un pur bruit statistique. Elle présente des régularités, des tendances, des profils, ce qu’on appelle des « patterns ». Dit en clair, la valeur en t+1 du taux dépendra quelque part des valeurs prises dans le passé (d’où le terme d’autorégressif). On peut aller plus loin : si l’on juge que le taux de change dépend des taux d’intérêt et de la balance commerciale, sans bien savoir comment tout ceci interagit, on mettra ces trois variables dans un même paquet et on fera une estimation statistique les reliant conjointement à leurs valeurs du passé.
Ces modèles ont la bonne intuition de la présence de patterns, n’ont pas une performance bien meilleure que les modèles structurels car ils restent très instables. Et à la différence des modèles structurels, ils ne permettent pas de donner une explication rationnelle de l’interaction entre ces variables.
On reconnait dans les modèles autorégressifs une forme plus sophistiquée d’une troisième technique, ancestrale celle-ci, qui est l’analyse technique, bien connue des traders. Ici, c’est empiriquement qu’on tente d’isoler des patterns et qu’on cherche à les catégoriser sous des formes standards. On dira qu’il y a un « head and shoulders » si la variable monte, atteint un palier, remonte à nouveau pour amorcer une baisse. Le début d’un head and shoulders est un signal de vente pour le trader qui pense l’avoir repéré.
On se moque souvent de l’analyse technique. À tort, parce que si un nombre suffisant d’opérateurs identifie (éventuellement à tort dans l’absolu) une figure commune, la prophétie devient autoréalisatrice et le marché se conforme à ce qu’on anticipe à son sujet. Ensuite et surtout, parce que cette technique aide à ancrer les anticipations des intervenants : en l’absence de toute bonne information, il faut quand même disposer de règles de décision. La question n’est pas que la règle soit bonne ou mauvaise, elle est qu’il faut une règle pour figer une anticipation et passer à l’action.
La dernière technique, naissante, c’est l’IA dont on voit qu’elle emprunte des trois techniques qu’on vient de décrire. C’est un domaine de recherche actif utilisant différents algorithmes, réseaux de neurones, forêts aléatoires, etc. On entraine le modèle sur des millions de situations de marché, intégrant éventuellement certaines variables explicatives que la réflexion économique a pu identifier, mais sans imposer une relation structurelle précise. On espère ainsi reconnaître certains patterns persistants.
Un papier récent de plusieurs chercheurs examine la capacité d’un modèle d’IA à prédire des indicateurs de stress sur trois marchés financiers aux États-Unis : bons du Trésor, taux de change du dollar, et taux du marché monétaire. Voir : Predicting financial market stress with machine learning. On y montre que le modèle utilisé bat largement les méthodes reposant sur l’autorégressivité, même si sa performance reste encore sommaire. Cet autre papier utilise un CAPM augmenté par l’IA, un IAPM pour Artificial Intelligence Pricing Model : Artificial intelligence and asset pricing: The power of transformers. Les auteurs battent les prévisions utilisant le CAPM classique. On gage que les grands fonds quantitatifs ont leurs techniques propres, qu’ils cachent jalousement de leurs concurrents.
Est-ce à dire qu’on peut envisager un jour de prédire les marchés ? Bien sûr que non, car une fois de plus, l’usage à succès de ces techniques est autodestructeur puisque cela rend le marché davantage efficient. La course est sans fin. Chaque homme dans sa lumière s’en va vers la nuit, pour paraphraser Hugo.
Découvrez d'autres articles
