Probabilités et énigmes

Maîtriser les probabilités en s'amusant ?

C'est possible avec quelques énigmes célèbres ou inédites !

Stationnaire, jusqu'à quel point ?

En mathématiques et en physique, il est habituel d'ajouter des mentions particulières. Ainsi en probabilités, on lit souvent "on suppose l'équiprobabilité" ou "la loi normale". Mais comprend-on ce que veut dire "stationnaire" ? En toute rigueur, on parle de problèmes dont les paramètres ne varient avec le temps. Effectivement si tel n'est pas le cas, tout problème peut se montrer ardu !

En probabilité, la stationnarité est parfois évidente, mais sait-on vraiment quels sont les processus stationnaires et ceux qui ne le sont pas ? Quelle est la limite entre ces deux états ? Dans cet article on examinera différents exemples et on montrera les difficultés de ce concept.

Une pièce de monnaie

Il est habituel de supposer l'équiprobabilité entre Pile et Face. Quoi de plus simple ?

En réalité, il existe des pièces qui favorisent l'un des deux tirages. Il suffit que la pièce soit légèrement concave ou les bords arrondis de façon dissymétrique. Sur un tirage particulier, rien n'est garanti, mais sur disons des centaines on pourrait voir soit pile soit face favorisé. De combien ? Seule l'expérience par la méthode du khi_deux peut fournir une réponse satisfaisante. J'invite le lecteur à se documenter à ce sujet : il existe une abondante bibliographie à ce sujet.

Mais ici, la question est un peu différente. Supposons à tort ou à raison les probabilités de pile ou face. Il s'agit de savoir si celles-ci peuvent varier dans le temps. Cela semble impossible, car il faudrait que la pièce se déforme : soit en devenant plus ou moins concave, soit en voyant les bords s'user de façon dissymétrique. Si cela se produit, on peut penser que le nombre de tests dépasse le million, le milliard, voire davantage. Autant dire que les risques sont limités à l'échelle de la soirée, voire de l'année !

Que la pièce soit truquée ou non, on peut dire qu'à notre échelle de temps ces probabilités restent stationnaires.

Un dé

Là aussi il est habituel de considérer les probabilités d'apparition de chaque face comme équiprobables.

Mais il existe des dés qui ne respectent pas l'équiprobabilité. Un dé pipé peut être fabriqué en glissant un plomb dans un morceau de bois au sein de ce dé. La fabrication et le recollage du dé demande beaucoup d'adresse, mais est toujours possible. Le centre de gravité est alors déplacé et l'équiprobabilité faussée. C'est encore plus simple avec un dé en plastique non-translucide : il suffit de glisser le plomb au moment du moulage. Ce que l'on sait encore moins c'est qu'il facile de favoriser le 6 : il suffit que les points soient gravés profondément en creux. Il n'y a qu'un seul creux du côté du 1 donc le centre de gravité se trouve légèrement déplacé vers cette face. En s'arrêtant avec la face 1 collée sur la table, c'est donc bien le côté opposé 6 qui est favorisé. Les dés des casinos n'ont pas leurs 21 points gravés en creux. On peut aussi se dire que des bords arrondis de façon dissymétrique peuvent gêner le roulage sur la table et favoriser certains tirages.

Il s'agit de savoir si ces probabilités peuvent-elles évoluer avec le temps ? Pipé ou non, un dé ne changera pas. Par contre, pourquoi pas une usure dissymétrique dans le temps ? Au bout de plusieurs millions de tirages, les bords d'un dé peuvent s'user, mais il est peut probable que certains le soient beaucoup plus que d'autres. Mais soyons prudents, un statisticien dirait que si l'on testait un million de dés des milliards de fois, il y aurait bien un ou deux dés qui seraient devenus atypiques, au point d'affirmer que les probabilités aient changé.

Là encore, à notre échelle de temps, les probabilités d'apparition de chaque face restent stationnaires.

Une liaison informatique sur un lien télécom

Un taux d'erreur binaire (TEB ; Bit Error Rate (BER)) est une probabilité : c'est le rapport du nombre de symboles binaires faux sur le nombre total émis. Généralement on suppose que c'est une constante, mais jusqu'à un certain point seulement, le temps de la mesure ou le temps de la session. En télécom, une probabilité typique est de l'ordre de 10-6 ou 10-7, dans certains cas : 10-11. De telles mesures demandent beaucoup de temps, surtout si le débit est faible et que le TEB à mesurer est lui aussi faible. On peut envisager des cas où ce TEB varie pendant le temps de la mesure !

Néanmoins, sur une liaison télécom sur fibre optique, cela ne pose pas de problèmes particuliers. On peut supposer que ce TEB ne varie pas sur plusieurs heures, voire jours ou mois. Au-delà de quelques années, les composants actifs vieillissent (laser, amplificateurs, diode de réception) et leurs performances se dégradent : le TEB augmente.

Pour une liaison sur cuivre, on peut aussi supposer que le TEB ne varie pas sur quelques heures, mais ce n'est pas toujours vrai. On peut observer des cycles diurnes (de 24 heures) : sur certaines lignes le TEB augmente la nuit. Dans d'autres cas, des perturbateurs peuvent apparaître de façon imprévisible ou spontanée : le TEB se dégrade brutalement et sur un temps très réduit.

On suppose la stationnarité. Ce serait uniquement en cas de fonctionnement normal, mais pas lors perturbations imprévues ou après un vieillissement des composants.

Les paris sportifs

On peut considérer les performances sportives comme sujets à des probabilités, même si faire des statistiques sur des événements isolés n’est pas une chose recommandée. Forme ou méforme d’une équipe de football, d’un cheval, performances d’une écurie de Formule 1, les bookmakers refont leurs cotes en permanence.

On peut donc dire que passé quelques mois, voire quelques semaines ou quelques jours, on n’a plus affaire à des processus stationnaires.

Intentions de votes

Il est normal que les électeurs changent d’avis lors d’une campagne électorale. Si un sondage annonce un résultat, celui-ci ne décrit la situation qu’à un instant donné. Un nouveau meeting, une interview, un scandale ou une mise en examen et les intentions de votes évoluent. En fait, il y a deux types d’électeurs : ceux qui ne changeront pas d’avis, disons avant plusieurs mois ou années, et ceux indécis qui peuvent changer d’intention de vote en quelques jours. Même si ces derniers ne représentent que quelques pourcents, ils suffisent pour faire basculer un scrutin.

Passé quelques jours ou semaines, ce type de processus n’est plus stationnaire.

La probabilité qu’un trou noir soit une "porte" vers un autre univers…

Pardon ? Il y a une forme d’abus de langage ! Que l’on puisse à la lumière des dernières découvertes supposer que les trous noirs aient un univers ou tout autre chose en leur intérieur, pourquoi pas. Mais cela reste hypothétique et une telle affirmation est soit vraie soit fausse (la probabilité est alors indéterminée et ne peut prendre que deux valeurs : zéro ou un) et toute autre valeur serait impossible. Maintenant, nombreux sont ceux qui parlent en un tel cas de « degré de croyance », et rien ne l’interdit. Alors, ce degré de croyance peut suivre les évolutions des découvertes de la sciences.

On peut douter que la notion de stationnarité ait un sens pour un événement qui est soit vrai soit faux. En fait si on parle de probabilités en de tel cas, ce n'est ni réellement interdit ni dénué de sens, mais bien différent des probabilités habituelles.

« Ma mesure est à 95% dans l’intervalle de confiance »

Ce n’est pas tout à fait cela ! Souvent on dit aussi « j’ai 95% de chance que ma mesure soit dans l’intervalle de confiance », ce qui est légèrement mieux. Une tournure plus correcte serait : « Si mon modèle est correct, et si je refaisais un grand nombre de fois mes mesures, mes calculs ou mes sondages, 95% des résultats obtenus seraient alors dans l’intervalle de confiance ».

On se rapproche du cas précédent. Il faut souligner que la valeur cherchée ne bouge pas, par contre ce sont mes mesures qui se succèdent plus ou moins proches de cette valeur. Puis j'affirme que la plupart sont proches de cette valeur que j'encadre par une valeur "minimale" et une valeur "maximale" estimées.

On note aussi la précaution " Si mon modèle est correct ". Généralement on le suppose être très proche d'une loi normale ou ce genre de choses. Si mon modèle est incorrect (une loi log normale au lieu de normale par exemple), alors on ne peut pas conclure. La valeur cherchée peut rester dans l'intervalle ou se retrouver en dehors. On ne peut pas conclure.

Si l'on suppose la stationnarité, il faut faire attention aux concepts de base des statistiques : le traditionnel "95%" (ou tout autre valeur proche de 100%) n’a pas tout à fait le sens simpliste qu'on lui donne dans les médias ou dans la vie de tous les jours.

Conclusion

La plupart des processus ne sont pas éternels et peuvent être vus comme stationnaires si le test, l'épreuve ou l'usage ne dure pas un temps trop long, c'est-à-dire plusieurs minutes, heures ou jours suivant le cas.

Dans d'autres cas, on ne manipule pas de probabilités classiques (degré de confiance, intervalles de confiances) et la notion de stationnarité n'est pas à envisager.

Voici un résumé des différents cas étudiés
  Expérience   stationnarité
  Pièce de monnaie   Quasi infini
  Dé   Quasi infini
  Liaison télécom fibre   Plusieurs années
  Liaison télécom cuivre   Plusieurs heures, jours ou mois, suivant les cas    
  Paris sportifs   Plusieurs jours
  Sondages intentions de vote       Plusieurs jours
  Théorie sur les trous noirs     En marge du concept  
  Intervalle de confiance     En marge du concept