Cas pratique avec 10 trios.
Soit 10 dégustateurs différents ( ou 5 dégustateurs qui doublent ).
Si 10 réussites sur 10( trouver celui qui est différent ) , alors "ça marche", le machin crée une différence perceptible. Toutefois, car il arrive même aux joueurs de gagner au loto, on n'en fera pas encore une vérité universelle. Disons que ça marcherait, et qu'il faudrait refaire le teste ailleurs, autres dégustateurs, etc....
Si 9 réussite sur 10, on doit tomber à 95% d'intervalle de confiance au lieu de 99, donc ça marchotte avec plus de doutes, à recommencer pour voir la 2eme batterie.
Si 8 réussites, bof bof, c'est plus que discutable. Recommencer éventuellement, si la 2eme série fait 9/10 ou 10/10 il conviendra d'aviser. Le doute est permis.
Si 7 réussites sur 10 ou moins, il ne se passe rien ( de détectable ). Terminé, au revoir bonsoir.
Il est évidemment non autorisé de faire 100 séries de 10 et de garder le meilleur résultat
Vous aurez que le trio permet de se faire un premier avis avec 30 verres servis ( logiquement 15 de témoin et 15 de dynamisés ), ce qui peut passer avec 2.5 cl par personne pour 1 seule blle.
L'autre alternative avec un gros panel, plus simple pour l'analyse, c'est la doublette.
Ressentez vous une différence ? Oui ou Non, réponse forcée. Là c'est l'hypothèse bilatérale. Ce serait le tableau de droite.
Il a un biais psycho fort, car si par exemple Agnès s'attends à trouver une différence, et qu'elle se doute dans quoi elle s'embarque avant de gouter, elle risque de forcer ses réponses vers la différence 'OUI". Bon, moi, je pourrai forcer vers "NON".....
Plus intéressant et plus discriminant, le test unilatéral.
Il ne s'agit PAS de savoir SI il y aurait une différence, mais il faut savoir si le produit tient sa promesse d'être plus qq chose ou moins qq chose. Admettons que la bille kirlianisée dynamisée maraboutée ait pour promesse d'ouvrir le vin, qu'il soit plus intense, plus expressif, plus évolué, etc....je ne sais pas quoi, il appartient à l'inventeur de préciser.
Alors on regarde le tableau de gauche.
Ici il ,n'y a le biais psycho sur la différence ou pas puisqu'il faut trouver lequel est différent ( en étant plus "qq chose" ). Donc ce test aurait ma préférence dans les test doublette. Il est aussi plus facile à interpréter si on n'est pas fan de stat.
On évitera un petit nombre de répétition ( disons 10 ou 15 ). A partir de 20 ( ou 4 fois pour 5 dégustateurs ), on peut par exemple juger que:
En dessous de 15 "bonnes" réponses ( sur 20 ) c'est aps bon.
15 bonnes rep / 20 , c'est bon à 95% d'intervalle de confiance,
16 bonnes rep, on est bon à 99%,
18 bonnes rep, on est bon à 99.9 %
Donc à 18 bonnes rep sur 20, le produit doit urgemment être commercialisé.
En dessous de 15 aussi, mais il touchera pas le même public.....