Ce blog me semble être un assez bon intermédiaire entre d'une part les recherches et les enregistrements écrits au tout venant et au fil de l'eau, et les bases de données de référence et autres pages plus rangées du site comme celle sur les ressources. J'ai toujours pensé intuitivement qu'un marque-page est une connaissance particulièrement précieuse, il suffit de constater comment certains s'auto-flagellent lorsqu'ils en perdent un...Mon intuition s'est vérifiée lorsque j'ai découvert StumbleUpon ("http://www.stumbleupon.com"). Un bon traitement de l'information se résume TOUJOURS à deux choses : évaluer la valeur d'une information en fonction de sa durée de vie (plus elle est vieille, plus elle fait référence), et être capable de ranger cette information dans un dispositif de cartographie (capacité à retrouver l'info et à la relier à d'autres).
Salut à tous, j'ai trouvé un plugin d'analyse des images sous RapidMiner / Yale. Je parle de ce dernier sur le site...
A+,
Hiramash.
En fouillant un article précédent de ce blog, à savoir les Coupled-Map Lattice, j'ai trouvé un modèle de carte chaotique appelé "Carte du Chat" comme cas particulier de carte d'Anosov. L'utilisation est spectaculaire, puisque cet automate peut brouiller une image jusqu'au chaos, puis après un certain nombre d'itérations, revenir à l'image originale. Illustration ici :
http://hypatia.math.uri.edu/~kulenm/diffeqaturi/victor442/index.html
Par ailleurs, l'examen des équations de la carte montre que le Nombre d'Or y joue un rôle fondamental en tant que valeur propre de la matrice.
A+,
Hiramash.
Un système "OCR", c'est-à-dire de reconnaissance des caractères, qui plus est sur de l'écriture manuscrite tibétaine, ça vaut le détour :
http://www.buddism.ru/ocrlib/
L'hypothèse Sapir-Whorff énonce que toute langue est créatrice d'une façon de penser. A l'inverse, Noam Chomsky avance qu'il existe une grammaire universelle reflétant des points communs entre les langues du monde, et reflétant surtout la structure commune des cerveaux humains.
Entre les deux, les jansénistes de Port-Royal avaient échaffaudé une théorie de la mathématique du langage bien avant l'heure ici : http://fr.wikipedia.org/wiki/Logique_de_Port-Royal.
A+,
Hiramash.
Je viens de trouver un blog sympatoche, je prends contact avec le propriétaire pour partenariat...
http://www.inclassablesmathematiques.fr/
En cherchant un éditeur gratuit sur le Web, Gérard m'a poussé l'adresse d'un portail éditorial dont voici une des adresses :
http://fr.calameo.com/read/000046992c9838e3b22c0
C'est probablement une affaire d'algèbre linéaire qui permet de calculer l'inflation à venir, en fonction des options commerciales, politiques et économiques que nos décideurs peuvent prendre.
A+,
Hiramash.
Cet incroyable article qui montre qu'enfin une sorte "d'hypergéométrie" a été posée, au moins au niveau théorique. C'est publié sur un site du CNRS, et la manière dont c'est écrit me rend perplexe. Est-ce un canular ? Un écrit de la plus haute importance ?
LA manière dont c'est présenté me fait plus penser à un traité d'hermétisme qu'un article de mathématiques comme on y est habitué. Je suis sidéré du côté Da Vinci code, mais si ce qui est dit est vrai et après en avoir vérifié les références, je crois que c'est digne d'attention.
Cette "hyper-géométrie" semble se justifier par le seul raisonnement logique et abstrait, en s'affranchissant de la notion de mesure. Exit les géométries différentielles, de Riemann, Lobatchevski, topologies, espaces de Sobolev, théories de la mesure, espaces hilbertiens ou euclidiens et autres !
L'article ici : http://images.math.cnrs.fr/Un-pas-vers-la-geometrie-quantique.html
A+,
Hiramash.
Un échantillonnage, au sens "traitement du signal", se fait à cadence régulière. Malheureusement, les contingences industrielles amènent à acquérir les données quand elles se présentent, sous forme d'événements et "d'interruptions processeur". Quand on utilisait des cadences régulières d'échantillonnage, cette particularité-là ouvrait la porte à plusieurs théorèmes dont le "pythagore" détourné de son emploi géométrique originel, tandis que l'on traitait les interruptions (l'inattendu) dans un circuit spécial.
Une autre problématique d'échantillonnage se présente lorsqu'on cherche à estimer une variable sur une population sans avoir les moyens ni le temps d'effectuer la collecte sur toute la population. On a alors recours à l'analyse séquentielle de la "famille algorithmique Monte-Carlo".
Là, c'est différent, c'est une techno algorithmique qui semble émerger, il s'agit de "compressive sensing". Traduction des premières lignes :
"Compressed sensing" ou "Compressing sensing" est au sujet de l'acquisition d'un signal épars de la manière la plus efficace (sous-échantillonnage) à l'aide d'une base (NDT : vectorielle, peut-être) de "projection incohérente" (NDT : cohérence au sens temporel).
J'ai un sac de boules noires et blanches. 39 boules, dont 13 blanches et 26 noires. J'en tire une, quelle est la proba "boule blanche" ?
Sachant que j'en ai tiré une, il me reste 38 boules dont je ne connais pas a priori la distribution blanc/noir. Je tire une seconde boule sans remettre la première au sac, quelle est la probabilité d'avoir "boule blanche" ?
J'en tire une troisième, etc...Les loi binomiales et géométriques sont insuffisantes, on utilise alors la loi hypergéométrique que l'on peut essayer ici :
http://www.adsciengineering.com/hpdcalc/
Quand on parle de "N-grammes" en analyse textuelle, il faut préciser de quoi on parle. Est-ce au niveau du mot ou au niveau de la phrase ? Premier cas, on forme des N-grammes de lettres, deuxième cas on forme des N-grammes de mots.
Voici donc une adresse de visualisation des N-grammes de la phrase sortie des archives des ingénieurs de Google, ici :
http://www.chrisharrison.net/projects/trigramviz/index.html
Une référence : les petits papiers de Stanford, c'est autre chose que l'arrogance des docteurs français en statistiques !
Eurêka !
(c'est-à-dire que depuis que je suis admis dans l'anneau des mathématiques francophones, je fais du zèle LoL)
Il y a quelques temps, j'avais travaillé sur une problématique de "pronostics boursiers" : Quelle va être la valeur du NASDAQ dans cinq jours ? J'avais conçu un engin de calcul avec une précision diabolique, toutefois, s'il se trompait peu souvent, lorsqu'il se trompait c'était tout simplement catastrophique.
C'est un problème classique de suradaptation, que j'avais contourné par une segmentation à ma sauce. Cette étape était capable de signaler par le calcul "attention, je vais probablement me planter". J'avais donc là un filtre de queue de distribution : via certaines observations des phénomènes, j'étais capable de qualifier des situations anormales.
Or, il existe une théorie des queues de distribution que j'ai découverte il y a peu. Il s'agit de la loi de Pareto (économiste italien) qui stipule que 20% des gens possèdent 80% de la richesse nationale. En gros, c'est une théorie de l'inégalité qui caractérise la queue de distribution.
Du point de vue mathématique, le hasard inégalitaire de Pareto (les 20% de privilégiés) remplace le hasard égalitaire de la courbe en cloche, le "gros de la foule". Il y a mieux : les lois d'estimation de la population des privilégiés changent aussi.
Avant une élection, on fait des sondages sur des échantillons de population. Moyennant diverses contraintes, on dit qu'il y a une chance de se tromper entre les intentions de vote dans l'échantillons, et les mêmes intentions dans toute la population. Pour caractériser ce hasard, on fait appel à une courbe en cloche : l'erreur entre les conclusions de l'échantillon et les conclusions de la population est une erreur "de hasard égalitaire".
Maintenant, pour les événements rares, liés à une loi de Pareto, on a recours à une autre forme de hasard : On dit que la forme du hasard entre l'échantillon et la population (fluctuation stochastique) a la même forme que le hasard qui répartit les événements rares entre eux (distribution de probabilité). C'est un hasard auto-stable, caractérisé par une loi de Lévy.
Encore plus fort : Un développement théorique a été fait en théorie des ensembles avec des groupes, des dimensions, de la topologie, etc...L'interprétation géométrique de cet appareil a conduit à des "figures auto-stables", typiquement des fractals.
Reste à voir les applications concrètes de ces lois auto-stables, puisque tous les hasards utilisés en industrie sont gaussiens. En voici quelques ressources :
http://pi.314159.ru/longlist.htm
Où l'on découvre que la carte de Kohonen est un cas particulier d'automate cellulaire :
http://fr.wikipedia.org/wiki/Automates_cellulaires
J'ai découvert ça à l'occasion de la fonction "Explorateur CML" dans GIMP, qui permet de gérer les "Coupled Map Lattice" :
http://en.wikipedia.org/wiki/Coupled_map_lattice
J'explore ce que c'est et je vous en reparle...
A+,
Hiramash.