vendredi 25 janvier 2019

DeepMind StarCraft II (IA de Google) : Analyse complète de la présentation d'AlphaStar !


Hier soir se tenais la présentation des prouesses magiques de DeepMind en matière d’intelligence artificielle. A ce titre , Google a demandé à AlphaStar (sa nouvelle IA) d'affronter Liquid TLO et Liquid Mana pour voir si deux des meilleurs joueurs du mondes pourraient lui tenir tête. La rencontre a été très enrichissante et je vais vous la commenter ici.

- (0Min) De l'attente ... ça commence vers 28 Minutes avec du Blabla ...

- (33Min) C'est parti , et donc Tim Morten (StarCraft II Game Director) confirme dès le départ que la version utilisé pour apprendre à AlphaZero à jouer à SC2 est une version "modifié" du jeu originel. Ce qui tant à confirmer que cette version est bel et bien celle de PySC2 qui (rappel de mon précédent poste) exploite une information de scoring pour savoir en temps réel si l'user joue bien ou mal. Information qui n'existe pas pour tous ceux qui ont appris à jouer. La crainte que j'avais au départ est donc encore justifié ici. AlphaZero a appris à jouer en "trichant". Même si dans la partie présenté ce n'est pas le cas (puisqu'il s'agit d'une version naturelle du jeu) , cela n'enlève rien au fait qu'il a appris à jouer en sachant tout le temps ce que pourrait éventuellement faire comme coup l'adversaire. (Plus ou moins). Si notre apprentissage de SC2 avait été réalisé dans ces conditions , nulle doute que notre approche du jeu serait toute autre que celle que nous connaissons.

- (36Min) Étonnement , dès les premiers graphiques , on nous montre déjà l'AI de Deepmind supérieur aux autres AI et mêmes joueurs (Graphique Violet avec un dès dessiné dedans), comme si les matches avaient déjà été réalisés alors que les commentateurs ont commencé en disant "Nous ne savons absolument pas ce que cela vas donner".

- (37Min) Une seul et unique carte et surtout pas d'autres parce que le programme n'a pas appris à jouer ailleurs ??? Mais attendez , où se trouve l’intelligence artificielle écrasante si celui ci n'est pas capable de s'adapter aux conditions d'une Nouvelle Map inconnue ? Cette Map (Catalyst LE) c'est exactement celle fournie par défaut avec PySC2 !

- (38Min) Ils ont limité le nombre de Click-Per-Minute pour ne pas paraître "insensément rapide" ? Je ne comprend pas trop , si l'apprentissage est naturel , la machine doit interagir avec une souris et un clavier virtuels (à la manière d'un teamViewer ou d'une VirtualBox). Les clicks "insensés" sont juste impossibles parce que non assimilable par l'interface. A moins que la machine n'interagisse pas avec une souris et un clavier virtuelle mais directement en agissant sur le programme sans passer par une interface. ce serait vraiment cavalier. Pour bien comprendre , ce serait comme de dire à quelqu'un , toi tu vas apprendre à conduire une porche , et toi , tu vas apprendre à conduire une trottinette. Maintenant que vous avez passé 2 ans à apprendre à conduire vos bolides. On vas vous donner une même voiture  et on vas voir lequel de vous deux vas le plus vite ... Il me parait évident que celui qui a conduit une trottinette toute sa vie aura bien du mal à rivaliser...

- (39Min) Ce sera donc Liquid TLO qui jouera ... Un des meilleurs du monde , d'accord , ça je ne le remet pas en cause. Par contre ... Il jouera en Protoss contre Protoss ... Problème , c'est un joueur Zerg natif. (Wikipedia : https://liquipedia.net/starcraft2/TLO). Je ne dit pas que ce joueur n'est pas capable de jouer les autres races , je suis certain qu'il explose tout le monde avec n'importe quelle race , mais tant qu'à affronter une des meilleurs IA du monde , autant mettre toutes les chances de son coté , vous ne croyez pas ? Il annoncera à la 43ème minute que ça a été son souhait pour justement surprendre AlphaZero. Je reste dubitatif.

- (41Min) Sympas la petite interview de TLO , j'aime bien ce garçon en plus , ce qu'il dit est intéressant. Il parle de comment il s'est préparé pour la rencontre. Bon , est ce qu'on pourrait discuter avec AlphaZero aussi ? Histoire de voir un peut comment cette IA a préparé l'aventure ? Ah non , j'oubliais , une IA peut être terrifiante , incroyablement puissante , et pour autant être incapable de faire de tenir une conversation stable (Test de Turring tout ca tout ca)... Bref , je vous renvoie à mon édito pour comprendre où je veux en venir avec cette aparté...

- (48Min) Jusqu'ici la partie me semblait naturelle , mais maintenant , je m'interroge... Comment se fait-il que sur le duel entre Dragons , je vois bien les clicks de souris de TLO mais très peut pour AlphaZero ? A croire que (comme je le soupçonnait à partir de 38 minutes) la souris et le clavier ne soit pas "interprétés" par le client , mais les ordres sont directement envoyés à l'interface ... C'est ennuyeux , ça commence vraiment à ressembler à de la triche. A ce sujet , j'aurai bien aimé voir ce que voit AlphaStar et non pas le replay ... On aurait pu voir l'étendue des mouvements de souris. Parce que pour rappel , un joueur utilise une souris ... et une souris , ça ne vas pas d'un bout à l'autre de la Map en 1 click. Mais bon , il faudra surement faire l'impasse sur la vision d'AlphaStar. On aura le droit qu'à un replay provocateur qui montre la suprématie de la machine sur l'humain. Bref , on continue.

- (52Min) TLO nous rappel qu'il n'est absolument pas joueur Protoss ... Curieux de le rappeler avec ce rire jaune ... pour autant , c'était soit-disant un choix Personnel de créativité... comme clamé à 39 Minutes par l'organisateur... Comment , je soupçonnerait une entourloupe ? Mais non mais non ...

- (53Min) On nous explique qu'AlphaZero fait moins de click par minute que TLO ... Cela pour donner un coté "click intelligent" à la machine. Oui , d'accord , mais en même temps (de mon point de vue) , c'est quand même beaucoup plus simple de faire nettement moins de click quand on a plus besoin de bouger la souris ! Je trouverais même ça étonnant venant de la machine de simuler plus de click si de toute façon , l'interface Souris-Clavier disparaît. Cela vas hélas dans le sens de ce que je pense ... J'aurai bien aimé voir la vision d'AlphaStar et non plus un replay. Tout ce que cela donne comme sentiment , c'est que leur programme interagit directement avec l'interface sans avoir besoin de bouger le moindre curseur , et ca ... C'est de la triche ! A moins qu'une machine capable de faire bouger le curseur rien que par la pensé , ce qui augmenterais alors la vitesse du pointeur d'égale à égale , mais tant que ca ca n'existe pas , je ne suis pas surpris que TLO ait un APM plus rapide , il faut bien qu'il compense l'handicape que représente ses propres mains !

- (55Min) Ah beh voila ! c'était ce que je craignais le plus. La vision d'AlphaStar , on l'a ... C'est une vue où il voit TOUTE la map en un seul plan ! Mais c'est N'importe quoi !!! Et comme je le craignais aussi ... Pas de mouvement de souris ! Non , mais sérieusement , si vous voulez être pris au sérieux , faudrait commencer par donner à la machine la même interface qu'un être humain ! Parce que nous , pour rappel , quand on joue , on a la caméra à 10 mètres du sol et une minimap de 2 cms de large. Et donc j'imagine que la "super machine" a appris à jouer comme ça ? Bref , je commence à capter la super-cherie ...

- (57Min) Le leader de DeepMind nous explique qu'AlphaStar ne contient son attention que sur le cadre blanc et qu'il n'a pas le droit de cliquer en dehors de la zone blanche , histoire d'équilibrer le bordel. C'est bien joli , mais ça n’enlève rien au fait qu'attention ou pas , il a l'info de toute la carte en temps réel ! Cette vue d'ensemble est drôlement avantageuse , vous ne trouvez pas ? Qu'on le veuille ou non , ça reste un sacré handicape pour TLO qui ne peut jouir que d'une minimap ridicule en contrepartie. Pas très juste tout ça ...

- (58Min) ah , on apprend qu'on ne verra pas la deuxième game , comme c'est dommage , et commode aussi. On aurait bien aimé voir comment AlphaStar a réagit après avoir gagné une première game. Mais bon , a la place , on a un Rapport de TLO qui nous parle de ses impressions. bref ... AlphaStar a encore gagné. (Pas si surprenant que ça , j'aurai était pas mauvais moi aussi si j'avais pu jouer avec une caméra qui couvre toute la map... Bref.

- (1H48) Ah visiblement , y'a un autre joueur ... Un certain Mana , un excellent joueur aussi , ah , bon , toujours la même map et toujours les mêmes races jouées... Bon , d'après le Wikipedia du joueur , cette fois ci , c'est bien un joueur Protoss natif... Je regarde quand même (même si mon avis sur les tricheries restent les mêmes).

- (2H09) non mais attendez ... Maintenant , AlphaStar bouge carrément unité par unité ... Vous pensez vraiment qu'un être humain pourrait faire ça en plein combat ? C'est plus du StarCraft à ce compte là , c'est du FPS... Et sincèrement , vous pensez vraiment qu'AlphaStar pourrait réaliser cela si il était contraint d'utiliser une souris et un clavier réellement ? Bref , je pense que vous voyez où je veux en venir ... Dans StarCraft 2 , la capacité de bouger certaines unités vers un endroit particulier en plein combat pour se donner l'avantage , on appel cela "gérer sa macro" , mais Là , c'est plus de la Macro , c'est carrément du preso par perso ... Je ne vois sincèrement plus de différences entre ça et de la triche. Si AlphaStar doit rivaliser avec des humains , alors il faut le doter des mêmes handicapes que les humains , sinon , ça n'a plus rien d'incroyable ... c'est juste normal.

- (59Min) Bon , une deuxième game démarre et j'ai même plus envie d'en voir plus ... c'est bon , j'ai compris ... 2H30 de Blabla et de Game entre TLO pour nous montrer la toute puissance d'une machine qui nous écrase quand ... elle triche ! Je vais zapper sur les 2 heures restantes pour voir au moins si la carte change ou si les races de jeu change ...

- (2H23) On voit un reportage qui montre dans quelles conditions TLO et MANA ont joué et sincèrement , ils sont beaux à voir les mecs. C'est incroyable de voir tant de dextérité et tant de puissance dans leur jeu. l'APM s'affole , les clicks , les touches de clavier , ça fume sous leurs doigts. C'est juste magique à voir ! Cette rencontre aura au moins permis de mettre en avant une chose évidente , l'être humain peut être capable de réaliser des choses folles avec juste ses mains et son cerveau... Un ordinateur n'y parvient visiblement (pour le moment) qu'en trichant ...

- (2H30) Alors ça c'est formidable ... Ils ont accepté de bien vouloir virer certaines "astuces" qu'utilisent AlphaZero sans pour autant préciser lesquels. Ils se contentent de dire que dans la prochaine partie d’exhibition , nous verrons le jeu du coté de Mana directement et qu'AlphaZero jouera "un peu plus" comme un humain devrait le faire (au final , c'est comme ça que je l'ai compris même si ils broient un peut leur accent américain). Voyons cela ... (Cette Game , je vais la regarder entièrement)

- (2H32) Ah , ils ont lâché le morceau ... AlphaZero verra le jeu comme un humain. Comprenez par là , fini la vision complète de toute la Game... Dommage que ce ne soit qu'en exhibition. Mais j'ai vraiment hâte de voir ce que cela donnera...

- (2H44) Oh My God ! Mana a gagné ! Et magistralement en plus ! C’était glorious. Il a tout donné , et AlphaZero a été explosé ! Au moins , ca vient prouver tout ce que j'ai saisie jusqu'ici ... Merci Mana !

- (Le reste des 10 minutes de vidéo) Du Blabla pour essayer d'expliquer pourquoi AlphaStar a perdu face à Mana quand ils ont désactivé leur "astuces"... M'en fallait pas plus les gars ! Ciao !


Source : https://www.youtube.com/watch?v=cUTMhmVh1qs

Mon Avis : Un apprentissage biaisé pour favoriser sa simplicité , Des tests déjà réalisés en amont pour être certain que l'issue soit celle attendue , des mouvements de souris inexistant qui rendent la partie déséquilibré en donnant un avantage de vitesse énorme à AlphaZero , Une partie en 1v1 et pas autrechose que du PVP Direct sans perturbateurs externes sur une carte pré-établie et des races prédéfinie et surtout, Une putain de Caméra Générale Vue d'Ensemble qui donne un accès à toute la carte en un instant ! Même avec le Brouillard de guerre , c'est fou qu'ils soient partis de ce point de vue là... Bref ... Tout ça pour dire que même si AlphaStar a battue deux des meilleurs joueurs du monde de SC2 , je trouve , sans faire d'Hooliganisme primaire , que les méthodes usités pour arriver à cela sont plus que discutables. Au final , on se rend compte que quand Google cherche à faire le même coup d'éclat avec un jeu un peut plus technique que le jeu de Go, l'équipe derrière la machine ne peut s’empêcher d'user de quelques tricheries pour parvenir à ses fins. Cela reste mon avis , mais je ne vois pas ici d'avancé si "magique" que cela ... Tout au plus , une maîtrise de leur algorithme un peu plus poussée entaché par une série de moyens discutables avantageux pour parvenir à ce résultat. Disons que pour conclure , je commencerais à donner du crédit à ce genre de prouesse quand DeepMind (Google) apprendra à son super ordinateur à jouer à StarCraft 2 en installant uniquement une caméra sur un écran avec la même interface que la notre , et qu'il donnera à la machine comme contrainte de devoir bouger réellement une souris , exactement comme nous , on le fait sur un écran et une caméra de jeu limité par ses mouvements. En l'absence de ces handicapes "humains" , je ne m'amuserais pas à comparer les "prouesses" d'une machine avec celles d'un "humain", car dans ces conditions , c'est juste un déséquilibre évident que je qualifie ouvertement de "Tricherie" ! Ah , une dernière chose , on peut vraiment applaudir TLO et MANA qui ont réussit à tenir si longtemps et avec autant de rigueur face à une machine qui use de tant de tricherie pour parvenir à ses fins ... Et ce dernier match d'exib' qui démontre alors la puissance de Mana face à AlphaStar quand les subterfuges tombent ... Bon Sang , je suis en admiration face à lui (en plus , il joue Protoss , je l'adore). Bravo à eux ! L'équipe de Liquid peut être TRES fière de ces joueurs. Ainsi et pour finir , si je devait trouver de la magie dans tout ça , c'est évidement du coté de TLO et MANA que je la verrais ... Ils sont formidables ces joueurs Pro ! Et que Vive les E-Games !



Pour me soutenir , 4 moyens au choix désormais :
- Désactiver Ad-Block et accepter le CryptoMinage pendant la durée de votre visite !
- Ou juste en parler autour de vous et partager ce contenu ... ce sera déjà super ! Merci !

Aucun commentaire:

Enregistrer un commentaire

Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.