Remarques de G.R sur les affirmations de cet article solidement construit.

 

 

Dans cet article P.PIONCHON aborde le problème global de l’I.A pour résoudre  le problème des enchères ET du jeu de la carte.

Dans ma démarche personnelle commencée il y a dix ans je me sui délibérément focaliser sr le seul problème du langage des enchères et de la recherche de ses améliorations vis-à-vis du meilleur résultat possible, celui-ci étant le PAR de la donne OU la meilleure marque du système de topage établi pour cette compétition où se joue la donne !

J’avais déjà considéré à cette époque que le jeu de la carte était résolu à partir des algorithmes du « Double Mort » et de la « force brute » des ordinateurs. La connaissance du PAR, à cartes ouvertes étant triviale, depuis les travaux de BO HANGUN des années 2000.

Ceci étant établi ma démarche s’appuie sur les notions de Système Expert ET d’APPRENTISSAGE ultérieur de ce dernier.

 

Les explications de P.POINCHON m’éclaire bien aujourd’hui sur ma démarche car j’ai longtemps buté sur les « explications négatives » ; c.à.d les cas où le système d’enchère de référence ne donne pas de solution positive.

SIC : Grâce à l'apport d'un "Système Expert inverse", constituant in fine un "Système Expert bimoteur", l'explication négative est résolue très simplement par la comparaison des inférences inverses.

 

Les  "EXPERTONS" de P.POINCHON (Jouable à SA", "Fit majeur", "Faire une enchère forcing", "Manche certaine, chelem possible", "Situation forcing", "Manche et pas plus", etc... barrage, double fit, rapport risque/gain, autre), je les ai définis, moi, comme des attributs supplémentaires de mon Système Expert de Référence et c'est en fait la même notion que celle d’un Système Expert bimoteur de P.POINCHON, qui permet de résoudre les explications négatives pour des cas d’enchères non résolus « in fine » dans le système de référence.

 

Il est évident que les moyens financiers que P.POINCHON a pu mettre en œuvre avec des équipes compétentes lui ont permis d’aboutir ce qui n’est pas le cas d’un homme seul !!!!

Bravo donc à son article et à la réussite de WILL-BRIDGE.

 

 

Intelligence Artificielle
Les Echecs, le Go et le Bridge

Les jeux de stratégie

et l'informatique




En avant-propos de l'article :
L'Intelligence Artificielle et le Bridge
voici ce qui différencie fondamentalement
le Bridge des Echecs et du Go
et qui lui vaut un traitement spécifique.


       
Le traitement informatique des jeux de stratégie a toujours passionné les foules et dans le foisonnement d’articles souvent trop enthousiastes traitant de cette question, il est très difficile de savoir ce qu’il en est exactement.

En ce qui concerne les Echecs par exemple tout le monde a sans doute encore à l’esprit le « fameux » match qui avait opposé en 1997 Deep Blue à Kasparov, le champion du monde en titre.
A lire la Presse de l’époque, il s’agissait ni plus ni moins que du « match qui a changé le cours de l’Histoire ».
Créant un événement sans précédent dans l’Histoire de l’humanité, pouvait-on lire, Deep Blue avait été déclarée vainqueur à la suite d’un match revanche en 6 parties (3 nuls, 1 victoire de Kasparov, 2 victoires de Deep Blue).
La Presse s’était enthousiasmée et bien sûr en avait fait ses gros titres.

Seulement voilà :
le match avait eu lieu en public et tous, experts et journalistes spécialisés, en avaient été témoins…

En fait, d’après les experts unanimes, dans 3 parties le nul avait été concédé par Kasparov alors qu’il s’y trouvait en position avantageuse, dans la 2ème partie Kasparov avait abandonné alors qu’il tenait une position qui conduisait à un match nul et dans la 6ème partie Kasparov avait prématurément abandonné au 19ème coup à la suite d’un mouvement pour le moins bizarre…

Lors de la conférence de presse qui suivit ce match, tout le monde ayant bien compris ce qui s'était passé, Kasparov n’a pu échapper à la question :
« Maitre, pourquoi ce comportement aussi étrange ? »
Réponse du champion du monde :
« Je jouais contre un ordinateur, j’ai été déstabilisé… ».

Dans les quelques mois qui ont suivi ce match, le cours de l'action d'IBM a quadruplé... et puis tout a été oublié, on a cessé très vite de parler de ce grand pas de l’humanité.
Toujours est-il que par la suite, sa réputation ayant souffert de ce match, Kasparov demanda une revanche.

La réponse d’IBM mit un terme définitif à ce grand exploit technologique, rebaptisé à l'occasion "Fake Blue" par les initiés :
« Nous sommes vraiment désolés, cher Monsieur, mais nous avons démonté la machine et perdu le programme... »

Beau joueur, Kasparov qui fréquente assidûment les conférences très à la mode sur l’Intelligence Artificielle, avait déclaré « Ma défaite contre Deep Blue était une victoire pour l’humanité ».
... Vraiment ? Mais de quelle humanité ?


En ce qui concerne le Go il semblerait que ce soit très différent d’après les performances de l’AlphaGo de DeepMind, filiale de Google, qui a battu récemment bon nombre des meilleurs joueurs humains.

La grande nouveauté serait l’ « apprentissage par renforcement profond » de l’AlphaGo Zéro qui sait travailler sur des millions de parties (obtenues en jouant contre elle-même) avec, si l’on en croit ses auteurs, des capacités d’auto-apprentissage lui permettant d’apprendre à jouer à partir de zéro, sans aucune connaissance, sans rien savoir du Go.
Un parfait autodidacte, semblerait-il.

Malheureusement DeepMind a annoncé qu’elle ne participera plus à des compétitions homme-machine.

A-t-elle démonté sa machine ? A-t-elle perdu son programme ?

Le sujet étant très confidentiel pour des raisons économiques évidentes, il est bien difficile de savoir ce qu’il en est exactement.
En plus de la supercherie "Fake Blue", tout le monde se souvient de la triste histoire des "avions renifleurs". Mystère et prudence donc...

En tout cas la tentation est grande d’essayer de s’en inspirer et actuellement il est de bon ton d’utiliser les techniques inductives des « réseaux de neurones », surtout si l'on cherche à lever des capitaux.

Le Bridge s’y prête-t-il ?

Il faudrait déjà pour cela disposer de millions de donnes jouées par des champions pour que le système puisse s’entraîner et apprendre efficacement par l’exemple.

Contrairement au Go et aux Echecs, ces donnes ne peuvent pas être générées par la machine elle-même sans intervention humaine car au Bridge il y a une différence entre le « gagner » et le « bien jouer » :
on peut gagner en jouant mal et perdre en jouant bien !

Prenons par exemple une donne qui possède deux lignes de jeu, une qui gagne à 80 % et une seconde qui ne gagne qu’à 60 % :
le « bien jouer » consiste à prendre la ligne à 80 % mais il se peut que cette ligne perde alors que la ligne à 60% gagne.

Le simple fait de gagner ou de perdre ne peut donc pas être utilisé pour caractériser la "récompense" et il faut faire intervenir d'autres paramètres, le score obtenu en tournoi par exemple, mais alors ce procédé ne peut plus être automatisé.

Le Bridge est un jeu de comparaison qui ne trouve en effet sa véritable vocation qu'en tournoi où tous les joueurs jouent avec les mêmes jeux. C'est d'ailleurs ce qui en fait l'attrait essentiel, la chance étant ainsi éliminée.
Au Bridge le but du jeu est finalement, pour paraphraser Colette :
"Avec les cartes de tout le monde, jouer comme personne".

Pour les enchères, le problème est encore plus complexe car il faudrait faire intervenir un autre paramètre très difficile à déterminer ici avec cette méthode, l'espérance mathématique de gain.
Prenons par exemple la situation où 4P est un bon pari à l'enchère mais infaisable à la carte. Le top ira au mauvais joueur qui n'aura demandé que 3P !

Remarquons à ce propos que savoir si 4P est un bon pari ou non dépend typiquement du jugement d'un Système Expert (voir plus loin) qui pourra très facilement apprécier l'incidence les enchères adverses (notamment celles d'Est) et les plues-values éventuelles de sa main (cartes intermédiaires, honneurs bien placés, etc...).

Les donnes d’entraînement doivent donc obligatoirement être supervisées par des experts (ou alors il faudrait trouver une méthode de supervision automatique, ce qui ne simplifie pas le problème).

Mais le plus important d’après Philippe Pionchon, est qu’il existe une caractéristique essentielle qui distingue le Bridge du Go et des Echecs, sans même parler de l’existence ou non d’éléments cachés.

- Le Go et les Echecs sont des jeux qui dépassent complètement les possibilités humaines : la machine peut donc en effet y apporter des « idées » nouvelles.

- En revanche le Bridge est un jeu beaucoup plus simple sur le plan combinatoire :
les hommes le maîtrisent parfaitement et il a été totalement théorisé.

Au Bridge on ne joue pas contre des adversaires mais contre des configurations de cartes adverses que la théorie est parfaitement capable de déterminer :
que viendraient apporter des statistiques ?

Il ne s’agit donc pas de traitement statistique d’un domaine mal connu dont personne n’a la solution, mais de mise en œuvre de l’expertise d’un domaine parfaitement maîtrisé.

DeepMind ne s'y est pas trompé qui a préféré travailler sur un autre jeu de cartes, Hanabi, plutôt que sur le Bridge pourtant infiniment plus célèbre mais qui ne se prête pas à cette technique et où il n'y a plus rien à trouver depuis plus de 30 ans.


Comme cela est expliqué dans l'article complet :
L'Intelligence Artificielle et le Bridge ,
c'est cette maîtrise humaine qui fait toute la difficulté d’un traitement informatique du Bridge…

(voir « 12 - Le paradoxe de la difficulté »
et « 14 - Au Bridge, il y a obligation de résultat »)



will-bridge


Please publish modules in offcanvas position.