jeudi 24 janvier 2019

DeepMind et StarCraft II : Conférence à 19H00 ... AlphaZero triche selon moi !



Ce soir , chers amis , vous pourrez retrouver sur la chaîne officielle de Blizzard le rapport d'analyse de DeepMind ainsi que d'autres petites étrangetés du même ordre dans le domaine de inintelligence artificielle. Pour rappel , Google s'est rapproché de Blizzard depuis 2017 afin d’entraîner leur IA Alpha Zero (Apprentissage par Renforcement) Dans le domaine de StarCraft II. La société d'Alphabet avait également mis à disposition de la communauté tout les outils qu'ils comptaient utiliser pour parvenir à ces résultats en Open Source. Cela s'appel PySC2 et permet donc de générer modestement une IA avec la puissance d'apprentissage de nos machines qui ne soit pas "scripté" comme pourrait l'être celles des développeurs de Blizzard originel. Un an est passé et DeepMind semble pressée de montrer au monde ce qu'ils ont réussit à faire. Ainsi , ce soir même , à 19H00 , vous pourrez retrouver le petit reportage des familles qui devra vous en mettre plein la vue.
Au passage , si vous voulez rafraîchir vos connaissances sur l'IA par Renforcement , je ne saurais que trop vous conseiller cette excellente vidéo de SciencesEtonnantes qui résume bien la situation.

Source : Chaine Youtube de DeepMind pour suivre la conférence de ce soir
Vous pouvez également découvrir toute l'explication du principe d'apprentissage par renforcement greffé à StarCraft II avec l'aide de ce Youtubeur Thibault Neveu qui vous donne tout les détails techniques de la méthode utilisé par Google DeepMind.
Et si vous voulez pousser un peu plus le trip , je vous rappel que j'avais déjà réalisé un Edito sur l'IA actuelle ...


Mon Avis : Alors je suis partagé. D'un coté on a la prouesse de réaliser une IA qui sera capable de prendre des décisions factuelles dans un environnement bien plus complexe que ce que les Échecs et le jeu de Go représentent. Mais d'un autre coté , je viens de découvrir grâce à la seconde vidéo de Thibault Neveu que la méthode pour parvenir à ce résultat par AlphaZero , c'est de détenir une valeur "scoré" de son environnement en temps réel. C'est à dire qu'il a tout le temps un chiffre qui lui permet de savoir si ce qu'il fait est bien ou pas bien... Et là , ça cloche complétement selon moi ... Ce qui fait la richesse d'une partie de StarCraft II , justement , c'est qu'avant la fin de la Game , on ne sait RIEN de notre positionnement sur l'adversaire. Et l'apprentissage que nous avons subit sur cet excellent jeu prend en compte justement cette absence d'information. Ici , AlphaZero détient sans cesse la donnée de savoir si il fait bien ou mal , à mon sens , c'est une tricherie et cela vient littéralement entacher l'importance du message que Google voudra faire passer ce soir ... Dommage.
Qu'on se comprenne bien , la puissance d'AlphaZero est impressionnante , en tant qu’algorithme de connaissance supervisé , c'est brillant , et le fait de démontrer toute l'étendue de cette avancé sur StarCraft II est une excellente idée , puisque justement , cet univers et son environnement sont si complexe qu'il réclame la totalité des connaissance d'un individu pour lui laisser une chance de victoire. Seulement , offrir à AlphaZéro une telle information que son Score Permanent basé sur ses récoltes , son nombre d'unités agressives , passives et la comparaison avec celles de l’ennemi... c'est débile. Nous (êtres humains) on a pas appris comme ça. Alors même si ce soir , ils nous montre une IA qui gagnera face au meilleurs mondiaux , et même si pendant cette partie , ils désactivent cette information de score permanent , cela n’enlèvera rien au fait que leur Algorithme d'origine , le fameux PySC2 utilisé par DeepMind pour apprendre à jouer , aura basé tout son apprentissage sur cette donnée que nous (povres petits humains joueurs dans notre coin) n’avons jamais connue... Bref , je suis au regret de vous dire que selon mon avis , DeepMind a appris à jouer à StarCraft II en trichant !





Pour me soutenir , 4 moyens au choix désormais :
- Désactiver Ad-Block et accepter le CryptoMinage pendant la durée de votre visite !
- Ou juste en parler autour de vous et partager ce contenu ... ce sera déjà super ! Merci !

Aucun commentaire:

Enregistrer un commentaire

Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.