کنترل در سطح انسان از طریق آموزش تقویتی عمیق

کنترل در سطح انسان از طریق آموزش تقویتی عمیق

نامه مهندسان شرکت DeepMind برای مجله نیچر

در مقاله معنای هوشمندی در موتورهای جستجوی آینده به نامه‌ای اشاره شد که مهندسان شرکت DeepMind برای مجله نیچر ارسال کردند. در این نامه برای اولین بار از الگوریتم یک برنامه به نام deep Q-network رونمایی می‌شود که تحول مهمی در رویکرد آموزش تقویتی در هوش مصنوعی است. در ادامه بخشی از چکیده مقاله و لینک دانلود مقاله آورده می‌شود:
نظریه آموزش تقویتی معیار سنجشی فراهم کرده است، که عمیقا در پژوهش‌ها صورت گرفته بر رفتار حیوانات در روانشناسی و عصب‌شناسی ریشه دارد، در این نظریه بررسی می‌شود که چگونه عامل نرم‌افزاری می‌توانند کنترل خود را از این طریق بر محیط افزایش دهند. اما برای استفاده موفقیت‌آمیز از آموزش تقویتی در موقعیت‌های جهان واقعی عامل‌های نرم‌افزاری با وظیفه دشواری مواجه شده‌اند: آنها باید برداشت بهینه شده‌ای از محیط را از ورودی‌های حسی با کیفیت بالا دریافت کنند و از این تجربیات کلی شده گذشته برای موقعیت‌های جدید استفاده کنند.
...
در اینجا ما از پیشرفت‌های اخیر در یادگیری شبکه‌های عمیق عصبی برای توسعه یک عامل نرم‌افزاری جدید در هوش مصنوعی به نام deep Q-network استفاده می‌کنیم. این عامل می‌تواند با استفاده آموزش تقویتی سر به سر، سیاست‌های موفقیت‌آمیزی را مستقیما از ورودی‌های حسی با کیفیت بالا بیاموزد.
...

 

لینک دانلود مقاله

  • تاریخ : ۱۳۹۷/۲/۴
دعوت از نظر شما :
contact@endregion.ir