Synchronie City: résultats de l'expérience E3 prolongée

Synchronie City

Résultats de l'expérience E3 prolongée

(jusqu' à 2000 réponses)

du 14 juin au 29 juin 2018

Comptes arrétés à 2000 résultats

* * *

Nombre d'affichages d'image avec légende = 1279

Nombre de réponses enregistrées = 2000

		HA	HB	Evaluation	Probabilité
1	Nombre total de tirages	2529	2449	Non significatif	1 / 8
2	Nombre total de tirages identiques (HA+HA ou HB+HB)	636	596	Non significatif	1 / 8
3	Nombre de tirages ayant fait l'objet d'une réaction	2034	1964	Non significatif	1 / 7
4	Nombre de tirages identiques ayant fait l'objet d'une réaction	517	482	Non significatif
5	Nombre de tirages validés	939	888	Non significatif
6	Nombre de validations d'image	438	442	Non significatif
7	Nombre de validations de légende	501	446	Significatif	1 / 25
8	Nombre de doubles validations (image + légende)	161	145	Non significatif
9	Nombre de rejets d'image	380	382	Non significatif
10	Nombre de rejets de légende	376	384	Non significatif
11	Nombre de doubles rejets (image + légende)	171	171	Non significatif
12	Nombre de tirages décisifs sur validation d'image seule	14	17	Non significatif
13	Nombre de tirages décisifs sur validation de légende seule	35	32	Non significatif
14	Nombre de tirages décisifs sur double validation	132	100	Significatif	1 / 50
15	Nombre total de tirages décisifs	181	149	Significatif	1 / 23

HA = tirage au sort supposé sensible au futur

HB = tirage au sort supposé partiellement insensible

( Les nombres aléatoires de HA et HB sont puisés à la même source )

* * *

Expériences précédentes: E1 E2 E3

Discussion

La principale différence entre la première semaine de l'expérience E3 et la seconde semaine durant laquelle elle a été prolongée, jusqu'à doubler le nombre de réponses, est l'annonce qui a été faite samedi dernier du résultat de E3 à 1000 tirages. Si l'on compare les nouveaux résultats avec les précédents, il apparaît clair que cette annonce, sans pour autant augmenter sensiblement le nombre de réponses par jour, a fortement motivé les participants à donner des réponses dans les deux catégories de scores données gagnantes (14) et (15). Alors que les réponses dans les catégories non données gagnantes mais comparables (12) et (14) n'ont fait que logiquement être multipliées par 2, celles qui ont été faites dans les catégories (14) et (15) ont été multipliées par 3. Il apparaît ainsi que l'annonce des résultats au milieu de l'expérience prolongée a engendré un biais cognitif qui a encouragé les participants à répondre exagérément dans les catégories gagnantes.

C'est très probablement ce qui explique que les écarts entre HA et HB dans les scores de (14) et (15) ont continué de se creuser mais en augmentant deux fois moins vite qu'ils auraient du, ce qui a eu pour conséquence d'empécher leur probabilité de continuer à diminuer fortement (sauf en milieu de semaine où elles ont temporairement atteint environ 1/200). Malgré tout ces probabilités sont toujours restées significatives et c'est ce qui compte et qui confirme les conclusions de E3 en faveur d'une influence du futur.

Une autre observation importante est que pour la première fois depuis le début des expériences le score des tirages avec HA a nettement surpassé celui des tirages avec HB, ce qui est le principal résultat attendu en cas d'influence du futur. Si cette influence est réelle, on s'attend en effet à ce qu'elle se traduise aussi par un excès de tirages HA sur les tirages HB effectués en aveugle par le biais des rideaux, ceci rejoignant les résultats déjà publiés par le chercheur Daryl Bem sur une expérience comparable. Cet excès n'est toutefois pas suffisamment significatif (probabilité 1/8), parce que l'écart n'a commencé se creuser qu'après notre correction de biais sur les clicks en milieu d'expérience. Mais si l'on ne tient compte que des résultats de la seconde semaine, ce qui par soustraction de la première nous donne HA=2529-1278=1251 et HB=2449-1280=1169, alors l'écart sur les tirages en aveugle devient significatif avec une probabilité égale au seuil de 1/20.

Il est en effet fort probable que c'est la correction du biais de E1 occasionné par les clicks trop rapprochés sur les rideaux d'images puis de légendes qui a permis à HA de distancer HB, car ce biais favorisait HB. C'est notre second test de biais (test des 10000 clicks) qui l'a mis en évidence , à l'issue duquel il a été trouvé une parade pour éviter ces clicks rapprochés. Toutefois, en même temps que ce test il est apparu une fragilité du serveur lorsque plusieurs personnes l'utilisent au même moment, qui s'est traduite entre autres par une remise à zéro incomprise de notre compteur de biais. Cette fragilité plutôt génante sème le doute sur notre capacité à éliminer tous les biais, qu'il faudra renforcer à l'avenir.

Mais le résultat le plus intéressant de E3 prolongée est l'excès du nombre de validations de légende tirées avec HA plutôt qu'HB. Cet excès significatif est confirmé par l'excès inverse (bien que non significatif) des rejets de légendes issues de HB plutôt qu'HA. Il semble ainsi que la légende aurait une meilleure capacité à inspirer le candidat de façon non illusoire (c'est à dire sous une vraie influence du futur). Cela s'expliquerait probablement par le fait que le message transmis par une légende serait plus précis que celui transmis par une image, dont l'interprétation est effectivement plus ambigüe. Toutefois, il apparaît que l'image joue un rôle important car ce n'est que lorsque la légende et l'image sont toutes les deux reconnues comme valides que la décision supposée "influencée par le futur" tend à être prise, si l'on considère les excès de HA dans les doubles validations décisives.

Conclusion

Cette quatrième campagne expérimentale est la première à aller dans le sens de la validation des deux principaux résultats attendus:

Influence du futur favorisant les tirages en aveugle avec HA bien que HA et HB soient équiprobables
Influence du futur favorisant la validation par les participants des tirages effectués avec HA (ou leur rejet avec HB).

Les probabilités des écarts de scores restent toutefois trop proches du seuil de 1/20 et il faudra donc progresser sur différents points (amélioration du protocole, pas d'annonce dans le cours de l'expérience, élimination plus sûre des biais) avant d'aboutir à une expérience réellement solide. Quoi qu'il en soit les résultats de E3 et de E3 prolongée sont très prometteurs pour la suite, s'agissant de valider scientifiquement et publier l'influence du futur sur les tirages, c'est à dire sur le hasard.

* * *

Suite: Expérience E4