یک عملگر نقاد پیشرفته برای یادگیری عامل در محیط بازی فوتبال گوگل
An Advanced Actor Critic for Agent Learning in the Google Football Game Environment
نویسندگان :
شقایق صفاری ( دانشگاه سمنان ) , مرتضی دٌرّیگیو ( دانشگاه سمنان ) , فرزین یغمایی ( دانشگاه سمنان )
چکیده
این مقاله یک الگوریتم یادگیری تقویتی عمیق را که عملگر نقاد پیشرفته نامیده میشود و بر اساس الگوریتم عملگر نقاد است، برای آموزش هوشمصنوعی بازی فوتبال ارائه میدهد. از آنجاییکه گاهی در برخی حالات، برخی اقدامات لزومی ندارند که اعمال شوند، بنابراین این مدل به منظور دستیابی به تخمین ارزش دقیق و انتخاب صحیح عمل در فضایی پیوسته معرفی شده است. لذا وجود معیاری برای ارزیابی میزان اهمیت و مزیت هر عمل در هر حالت میتواند پارامتر ارزشمندی باشد. از این رو با توجه به مزایای مدل Dueling DQN و عملگر نقاد، مدل ارائه شده از ترکیب شبکه Dueling DQN در معماری عملگر نقاد استفاده کرده است. هدف، بهبود عملکرد الگوریتم عملگر نقاد معمولی در یک محیط پیچیده است. مطالعه موردی از اموزش هوشمصنوعی بازی، بازی فوتبال است. نتایج تایید میکند که الگوریتم بهبود یافته به طور موثر عملکرد را از نظر میانگین پاداش، نسبت به هر یک از دو مدل Dueling DQN و عملگر نقاد به صورت جداگانه بهبود میدهد. تجزیه و تحلیل در مورد چگونگی بهبود عملکرد مدل ارائه شده نیز، در بازی فوتبال ارائه شده است.کليدواژه ها
یادگیری تقویتی عمیق، بازی فوتبال، عملگر نقاد، Dueling DQN، عملگر نقاد پیشرفتهکد مقاله / لینک ثابت به این مقاله
برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است :نحوه استناد به مقاله
در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:شقایق صفاری , 1400 , یک عملگر نقاد پیشرفته برای یادگیری عامل در محیط بازی فوتبال گوگل , هفتمين کنفرانس بين المللي بازی های رايانه ای فرصت ها و چالشها
برگرفته از رویداد
دیگر مقالات این رویداد
© کلیه حقوق متعلق به دانشگاه اصفهان میباشد.