Synchronie City

Résultats de l'expérience E3 prolongée

(jusqu' à 2000 réponses)

du 14 juin au 29 juin 2018

Comptes arrétés à 2000 résultats

* * *

Nombre d'affichages d'image avec légende = 1279

Nombre de réponses enregistrées = 2000

 
HA
HB
Evaluation
Probabilité
1 Nombre total de tirages
2529
2449
Non significatif
1 / 8
2 Nombre total de tirages identiques (HA+HA ou HB+HB)
636
596
Non significatif
1 / 8
3 Nombre de tirages ayant fait l'objet d'une réaction
2034
1964
Non significatif
1 / 7
4 Nombre de tirages identiques ayant fait l'objet d'une réaction
517
482
Non significatif
5 Nombre de tirages validés
939
888
Non significatif
6 Nombre de validations d'image
438
442
Non significatif
7 Nombre de validations de légende
501
446
Significatif
1 / 25
8 Nombre de doubles validations (image + légende)
161
145
Non significatif
9 Nombre de rejets d'image
380
382
Non significatif
10 Nombre de rejets de légende
376
384
Non significatif
11 Nombre de doubles rejets (image + légende)
171
171
Non significatif
12 Nombre de tirages décisifs sur validation d'image seule
14
17
Non significatif
13 Nombre de tirages décisifs sur validation de légende seule
35
32
Non significatif
14 Nombre de tirages décisifs sur double validation
132
100
Significatif
1 / 50
15 Nombre total de tirages décisifs
181
149
Significatif
1 / 23

HA = tirage au sort supposé sensible au futur

HB = tirage au sort supposé partiellement insensible

( Les nombres aléatoires de HA et HB sont puisés à la même source )

* * *

Expériences précédentes: E1 E2 E3

Discussion

La principale différence entre la première semaine de l'expérience E3 et la seconde semaine durant laquelle elle a été prolongée, jusqu'à doubler le nombre de réponses, est l'annonce qui a été faite samedi dernier du résultat de E3 à 1000 tirages. Si l'on compare les nouveaux résultats avec les précédents, il apparaît clair que cette annonce, sans pour autant augmenter sensiblement le nombre de réponses par jour, a fortement motivé les participants à donner des réponses dans les deux catégories de scores données gagnantes (14) et (15). Alors que les réponses dans les catégories non données gagnantes mais comparables (12) et (14) n'ont fait que logiquement être multipliées par 2, celles qui ont été faites dans les catégories (14) et (15) ont été multipliées par 3. Il apparaît ainsi que l'annonce des résultats au milieu de l'expérience prolongée a engendré un biais cognitif qui a encouragé les participants à répondre exagérément dans les catégories gagnantes.

C'est très probablement ce qui explique que les écarts entre HA et HB dans les scores de (14) et (15) ont continué de se creuser mais en augmentant deux fois moins vite qu'ils auraient du, ce qui a eu pour conséquence d'empécher leur probabilité de continuer à diminuer fortement (sauf en milieu de semaine où elles ont temporairement atteint environ 1/200). Malgré tout ces probabilités sont toujours restées significatives et c'est ce qui compte et qui confirme les conclusions de E3 en faveur d'une influence du futur.

Une autre observation importante est que pour la première fois depuis le début des expériences le score des tirages avec HA a nettement surpassé celui des tirages avec HB, ce qui est le principal résultat attendu en cas d'influence du futur. Si cette influence est réelle, on s'attend en effet à ce qu'elle se traduise aussi par un excès de tirages HA sur les tirages HB effectués en aveugle par le biais des rideaux, ceci rejoignant les résultats déjà publiés par le chercheur Daryl Bem sur une expérience comparable. Cet excès n'est toutefois pas suffisamment significatif (probabilité 1/8), parce que l'écart n'a commencé se creuser qu'après notre correction de biais sur les clicks en milieu d'expérience. Mais si l'on ne tient compte que des résultats de la seconde semaine, ce qui par soustraction de la première nous donne HA=2529-1278=1251 et HB=2449-1280=1169, alors l'écart sur les tirages en aveugle devient significatif avec une probabilité égale au seuil de 1/20.

Il est en effet fort probable que c'est la correction du biais de E1 occasionné par les clicks trop rapprochés sur les rideaux d'images puis de légendes qui a permis à HA de distancer HB, car ce biais favorisait HB. C'est notre second test de biais (test des 10000 clicks) qui l'a mis en évidence , à l'issue duquel il a été trouvé une parade pour éviter ces clicks rapprochés. Toutefois, en même temps que ce test il est apparu une fragilité du serveur lorsque plusieurs personnes l'utilisent au même moment, qui s'est traduite entre autres par une remise à zéro incomprise de notre compteur de biais. Cette fragilité plutôt génante sème le doute sur notre capacité à éliminer tous les biais, qu'il faudra renforcer à l'avenir.

Mais le résultat le plus intéressant de E3 prolongée est l'excès du nombre de validations de légende tirées avec HA plutôt qu'HB. Cet excès significatif est confirmé par l'excès inverse (bien que non significatif) des rejets de légendes issues de HB plutôt qu'HA. Il semble ainsi que la légende aurait une meilleure capacité à inspirer le candidat de façon non illusoire (c'est à dire sous une vraie influence du futur). Cela s'expliquerait probablement par le fait que le message transmis par une légende serait plus précis que celui transmis par une image, dont l'interprétation est effectivement plus ambigüe. Toutefois, il apparaît que l'image joue un rôle important car ce n'est que lorsque la légende et l'image sont toutes les deux reconnues comme valides que la décision supposée "influencée par le futur" tend à être prise, si l'on considère les excès de HA dans les doubles validations décisives.

Conclusion

Cette quatrième campagne expérimentale est la première à aller dans le sens de la validation des deux principaux résultats attendus:

Les probabilités des écarts de scores restent toutefois trop proches du seuil de 1/20 et il faudra donc progresser sur différents points (amélioration du protocole, pas d'annonce dans le cours de l'expérience, élimination plus sûre des biais) avant d'aboutir à une expérience réellement solide. Quoi qu'il en soit les résultats de E3 et de E3 prolongée sont très prometteurs pour la suite, s'agissant de valider scientifiquement et publier l'influence du futur sur les tirages, c'est à dire sur le hasard.

* * *

Suite: Expérience E4