Ce blog me semble être un assez bon intermédiaire entre d'une part les recherches et les enregistrements écrits au tout venant et au fil de l'eau, et les bases de données de référence et autres pages plus rangées du site comme celle sur les ressources. J'ai toujours pensé intuitivement qu'un marque-page est une connaissance particulièrement précieuse, il suffit de constater comment certains s'auto-flagellent lorsqu'ils en perdent un...Mon intuition s'est vérifiée lorsque j'ai découvert StumbleUpon ("http://www.stumbleupon.com"). Un bon traitement de l'information se résume TOUJOURS à deux choses : évaluer la valeur d'une information en fonction de sa durée de vie (plus elle est vieille, plus elle fait référence), et être capable de ranger cette information dans un dispositif de cartographie (capacité à retrouver l'info et à la relier à d'autres).
| « Un site de vidéos pédagogiques en mathématiques | Les automates cellulaires » |
Eurêka !
(c'est-à-dire que depuis que je suis admis dans l'anneau des mathématiques francophones, je fais du zèle LoL)
Il y a quelques temps, j'avais travaillé sur une problématique de "pronostics boursiers" : Quelle va être la valeur du NASDAQ dans cinq jours ? J'avais conçu un engin de calcul avec une précision diabolique, toutefois, s'il se trompait peu souvent, lorsqu'il se trompait c'était tout simplement catastrophique.
C'est un problème classique de suradaptation, que j'avais contourné par une segmentation à ma sauce. Cette étape était capable de signaler par le calcul "attention, je vais probablement me planter". J'avais donc là un filtre de queue de distribution : via certaines observations des phénomènes, j'étais capable de qualifier des situations anormales.
Or, il existe une théorie des queues de distribution que j'ai découverte il y a peu. Il s'agit de la loi de Pareto (économiste italien) qui stipule que 20% des gens possèdent 80% de la richesse nationale. En gros, c'est une théorie de l'inégalité qui caractérise la queue de distribution.
Du point de vue mathématique, le hasard inégalitaire de Pareto (les 20% de privilégiés) remplace le hasard égalitaire de la courbe en cloche, le "gros de la foule". Il y a mieux : les lois d'estimation de la population des privilégiés changent aussi.
Avant une élection, on fait des sondages sur des échantillons de population. Moyennant diverses contraintes, on dit qu'il y a une chance de se tromper entre les intentions de vote dans l'échantillons, et les mêmes intentions dans toute la population. Pour caractériser ce hasard, on fait appel à une courbe en cloche : l'erreur entre les conclusions de l'échantillon et les conclusions de la population est une erreur "de hasard égalitaire".
Maintenant, pour les événements rares, liés à une loi de Pareto, on a recours à une autre forme de hasard : On dit que la forme du hasard entre l'échantillon et la population (fluctuation stochastique) a la même forme que le hasard qui répartit les événements rares entre eux (distribution de probabilité). C'est un hasard auto-stable, caractérisé par une loi de Lévy.
Encore plus fort : Un développement théorique a été fait en théorie des ensembles avec des groupes, des dimensions, de la topologie, etc...L'interprétation géométrique de cet appareil a conduit à des "figures auto-stables", typiquement des fractals.
Reste à voir les applications concrètes de ces lois auto-stables, puisque tous les hasards utilisés en industrie sont gaussiens. En voici quelques ressources :
http://pi.314159.ru/longlist.htm
Trackback URL (clic droit et copier le raccourci / l'adresse du lien)