Audits Comey et McCabe : quelle est la probabilité que ce soit une coïncidence ?

New York Times Signalé Que l’Internal Revenue Service a donné l’un des types d’audits les plus stricts à James B. Comey, ancien directeur du FBI, et ancien directeur adjoint Andrew G.

Cela a soulevé beaucoup de questions parfaitement raisonnables, dont la plupart sont variables : Quelles sont les possibilités ? Comme le soulignait l’article, les chances que deux ennemis politiques de haut rang du président Donald J. Trump passent en revue par hasard sont très minces.

Mais minuscule n’est pas zéro.

Si nous devons croire qu’il s’agissait d’une coïncidence, à quel point pouvons-nous dire que c’est hautement improbable ? Ici, nous essayons d’estimer cette possibilité aussi sérieusement que possible.

Tout d’abord, les faits : les deux hommes ont été sélectionnés pour des audits dans le cadre du Programme national de recherche (PNR), un petit sous-ensemble de tous les audits que l’IRS effectue chaque année. Ces vérifications examinent un échantillon de déclarations pour recueillir des données sur la conformité fiscale.

Selon l’IRS, il y a eu environ 5 000 audits de ce type en 2017, 4 000 en 2018 et 8 000 en 2019 – choisis parmi environ 154 millions de déclarations de revenus individuelles chaque année. La vérification de M. Comey de sa déclaration de revenus de 2017 était ; McCabe était de retour pour 2019.

De nombreux aspects du PNR compliquent nos calculs, notamment la méthodologie d’échantillonnage des auditeurs de l’IRS et les différentes années des audits eux-mêmes. Nous reviendrons sur ces problèmes ultérieurement. Pour l’instant, nous supposerons que tous les contribuables ont une chance égale d’être audités et que les deux hommes ont été audités en 2017.

Si ce problème apparaissait dans un manuel sur les probabilités, vous pourriez lire ce qui suit :

S’il y a 154 millions de billes (le nombre approximatif de déclarations de revenus produites chaque année) dans une urne géante, et que quelques-unes sont rouges (celles représentant M. Comey et M. McCabe parmi eux), quelles sont vos chances ? Tirerez-vous deux boules rouges ou plus si vous en tirez au hasard quelques milliers dans le pot (le nombre de révisions cette année-là) ?

Cela peut sembler compliqué, mais c’est Un problème relativement bien pensé, ce que de nombreux étudiants en mathématiques ou en statistiques peuvent rencontrer dans leurs cours universitaires. Les gens ont déjà dérivé des équations pour estimer ces probabilités, avec des noms comme distribution hypergéométriquequi a des applications telles que l’audit des élections et le comptage des cartes.

Nous pouvons simplement entrer nos estimations pour le nombre total de boules, le nombre de boules rouges et le nombre de tirages, et nous obtiendrons une probabilité. Si nous pensons qu’il n’y a que deux boules rouges – c’est-à-dire si nous limitons l’exercice à Juste M. McCabe et M. Comey – Cette équation donne une probabilité de 1 sur 950 millions.

READ  Canada Graves : 182 restes humains dans des tombes anonymes trouvés sur le site d'un ancien pensionnat en Colombie-Britannique

Ce sont des chances bien supérieures à vos chances de gagner une partie de Powerball. C’est aussi un résultat presque dénué de sens. Au mieux, c’est la bonne réponse à la mauvaise question.

Comprendre pourquoi nécessite de reconnaître l’absurdité inhérente à notre exercice : pour estimer au mieux la probabilité d’un événement improbable, nous devons mettre de côté le fait que nous savons déjà qu’il s’est produit. (La probabilité que cela se produise est de 100%).

Jordan Ellenbergle professeur de l’Université du Wisconsin qui a écrit des livres sur les mathématiques et la pensée, l’a décrit ainsi : « Dans un monde irréel, quelle est la probabilité que cette chose se produise, qui s’est déjà produite dans notre univers ? »

Cela peut sembler étrange, mais les mêmes problèmes apparaissent même dans les exercices de probabilité de base comme lancer une pièce.

Si vous lancez une pièce 20 fois de suite, la séquence spécifique de pile et face est extraordinairement rare, environ une sur un million, mais cela s’est produit. Et le quelques La séquence de fluctuations se produira toujours. Ce n’est qu’une coïncidence surprenante s’il s’agit de la séquence que vous avez sélectionnée avant de retourner.

De la même manière, ce serait une erreur de restreindre la recherche aux seuls M. Comey et M. McCabe, car il est probable que nous examinerions ces possibilités si nous savions que deux autre Des ennemis politiques notables de l’administration ont été scrutés à la place de ces deux hommes.

Une meilleure question est : quelle est la probabilité qu’il y ait deux personnes ou plus Tel que M. Comey et M. McCabe, feront-ils l’objet d’un examen minutieux pendant cette période ?

Ce groupe de personnes devrait-il inclure deux hauts responsables du FBI ? Quels sont les deux hauts fonctionnaires du ministère de la Justice ? C’est ce cadrage – une décision subjective plutôt que factuelle – qui motive souvent toute estimation probabiliste, plus que tout choix de distribution statistique ou de poids d’échantillonnage.

Vous trouverez ci-dessous un graphique de la probabilité que notre équation donne différents choix pour le nombre de boules rouges, allant de deux (M. Comey, M. McCabe et personne d’autre) à 400 (une estimation prudente du nombre d’Américains M. Trump insulté par son nom sur twitter depuis le début de sa candidature à la présidence).

La probabilité augmente de façon exponentielle avec le choix de qui devrait être considéré comme une bille rouge aux côtés de M. Comey et M. McCabe.

READ  Des témoins ont déclaré que plus de 200 personnes avaient été tuées en Éthiopie lors d'une prétendue attaque ethnique

Le but n’est pas de décider d’un nombre mais de réaliser que notre choix de la taille du groupe est ce qui nous pousse à trouver la réponse. Bien que certaines suppositions soient certainement meilleures que d’autres, de nombreuses options sont défendables.

Essayons maintenant de le réduire à quelque chose d’un peu plus réaliste et revenons à certaines des choses que nous avons négligées dans notre explication simple de ce problème.

Premièrement, les deux hommes n’ont pas été audités pour la même année. En élargissant notre champ d’application pour couvrir la période de trois ans de 2017 à 2019, nos cotes résultantes augmentent de façon exponentielle. C’est simple : si une personne a une certaine opportunité de réviser au cours d’une année donnée, alors plus d’années signifie plus d’opportunités de réviser.

Deuxièmement, nous ne sommes intéressés que par la possibilité de choisir au moins deux personnes. Nous ne considérerons pas la probabilité qu’une même personne soit sélectionnée deux fois ; Cela semble peu probable étant donné que les audits pourraient s’étendre sur plus d’un an, selon le récit de M. Comey. Notez que nous examinons la probabilité de choisir au moins deux personnes, pas spécifiquement deux, car cela aurait également de l’importance si trois personnes ou plus étaient choisies dans un groupe.

Enfin, l’IRS ne sélectionne pas vraiment les gens au hasard. Au lieu de cela, l’agence a tendance à choisir certains types de contribuables, y compris personnes à revenu élevé, plus que d’autres. Pour l’année d’imposition 2001, un formulaire NRP est inclus donne des personnes autour du 90e centile de revenu à environ 1,7 fois le taux auquel on pourrait s’attendre, car les rendements ont été choisis indépendamment des revenus. Ce taux a augmenté dans les rangs les mieux rémunérés, les personnes dont les revenus se situant dans les 0,5 % les plus riches étant susceptibles d’être dix fois plus nombreuses dans l’échantillon que celles les plus proches du revenu médian.

Nous pouvons probablement supposer que n’importe quel groupe d’ennemis de M. Trump gagnerait plus qu’un échantillon aléatoire d’Américains. Mais nous ne pouvons pas estimer de manière réaliste le revenu total de chaque membre de notre groupe chaque année. Nous savons également que l’IRS a pris en compte d’autres facteurs dans l’échantillonnage, tels que Type de paiement Ce fichier des contribuables, et que les méthodes d’échantillonnage peuvent changer d’année en année. Cela nous laisse peu d’indications sur la façon de faire correspondre les méthodes de l’IRS. En tant que tel, nous laisserons nos estimations non pondérées par le revenu. Comme exercice au dos de l’enveloppe, si vous vous inquiétez de la façon dont le revenu affectera ces résultats, vous pouvez multiplier la probabilité résultante si vous pensez que les membres du groupe ont des revenus très élevés, et la multiplier par 10 si vous pensez qu’ils sont extraordinairement riche.

READ  Une organisation intergouvernementale prévient que la démocratie recule à un rythme record

Intégrant ces options, le tableau ci-dessous fournit quelques possibilités estimées en fonction de la taille du groupe considéré.

Alternativement, si nos options ne sont pas satisfaisantes, nous avons créé une calculatrice simple pour que vous puissiez créer vos propres cotes :

Quelle est donc la « bonne » estimation ?

La sortie la plus réaliste de cette équation peut être décrite avec précision comme « très rare » ou même « extrêmement rare », mais il n’y a aucune preuve d’erreur.

« C’est un peu comme une force irrésistible et une chose immuable », a-t-il déclaré. Andrew Gilman, professeur de statistiques et de sciences politiques à l’Université de Columbia, lorsqu’il a été informé dans le résumé de cet exercice. « D’une part, vous dites que c’est complètement aléatoire. D’autre part, vous soupçonnez que ce n’est pas le cas. »

M. Gilman, comme tout autre statisticien qui s’est entretenu avec le Times sur cette question, a déclaré que le plus gros obstacle n’était pas les détails, mais la définition de la question elle-même.

Lorsque nous essayons de calculer la probabilité d’un certain événement car Nous soupçonnons que ce n’est peut-être pas aléatoire, nous nous retrouvons dans une situation compliquée d’essayer d’imaginer comment nous aurions prédit la probabilité de l’événement Avant de Il a dit ce qui s’est passé David Spiegelhalter. Il dirige le Winton Center for Communication on Risk and Evidence à l’Université de Cambridge, une organisation dédiée à l’amélioration de la manière dont les preuves quantitatives sont utilisées dans la société.

Les calculs sont faciles, a-t-il dit, mais la formulation de la question est difficile, proche du « non-sens », en grande partie à cause de la difficulté de définir le groupe qui nous intéresse.

« Quelles sont les chances que cela se produise? » C’est une déclaration facile à faire. » « C’est une déclaration familière. Mais, en fait, il est très difficile de répondre à cette question. »

Les mathématiques ont leurs limites. Le but d’essayer d’estimer une probabilité comme celle-ci, a déclaré Gilman, n’est pas d’accorder beaucoup d’importance aux chiffres, mais de laisser le résultat vous pousser à en savoir plus.

Dans ce cas, la meilleure question n’est pas la réponse que vous pouvez rechercher dans un manuel de statistiques.

Au lieu de cela, a déclaré M. Gilman, la question à poser est : « Que se passe-t-il ?

Matthieu Collin Contribuer à la préparation des rapports.

Désiré Faure

"Evangéliste du café sans aucune excuse. Fanatique du Web. Nerd d'Internet. Geek de Twitter."

Related Posts

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Read also x