یادگیری عمیق reinforcement در پایتون

توضیحات

راهنمای کامل برای تسلط برهوش مصنوعی با استفاده از یادگیری عمیق و شبکه های عصبی
در این دوره چه چیزهایی یادخواهیدگرفت :
ساخت عوامل مختلف یادگیری عمیق
اعمال الگوریتم های یادگیری تقویت شده پیشرفته برای مقابله با هر مشکلی
• Q-learning با استفاده از شبکه های عمیق عصبی
• سیاست های گرادیان مشی خطی با شبکه های عصبی
• تقویت آموزش با استفاده از شبکه های RBF
• استفاده از شبکه های عصبی با Q-learning
در این دوره به چه مهارت هایی نیاز دارید ؟
تقویت یادگیری اولیه ، MDPs ، برنامه نویسی پویا ، مونت کارلو، یادگیری TD
احتمالات و محاسبات در سطح کارشناسی
تجربه ساخت مدل یادگیری ماشین در Python و Numpy
آشنایی با چگونگی ساختن یک فیدر ، حلقه ، شبکه عصبی مجدد با استفاده از Theano و Tensorflow
توضیحات :
این دوره در مورد کاربرد یادگیری عمیق و شبکه های عصبی برای تقویت یادگیری است
اگر شما اولین کلاس دوره تقویت یادگیری را گرفته باشید شما درک خواهید کرد که تقویت یادگیری یکی از ارکان اصلی هوش مصنوعی است
به طور مشخص ترکیبی از یادگیری عمیق با یادگیری تقویت منجر به ایجاد AlphaGo ، قهرمان جهان در بازی های استراتژی شود بعنوان مثلا ماشین های بدون سرنشین یا ماشین هایی دربازی های فوق العاده که ، در سطح انسان عمل میکنند را ، نشان دهد
تقویت یادگیری از دهه 70 آغاز شده است، اما تاکنون هیچ یک از اینها امکان پذیر نبوده است.
جهان با سرعت بسیار زیاد تغییر می کند
ایالت کالیفرنیا قوانین خود را تغییر می دهد به طوری که شرکت های خودرو سازی خودشان می توانند بدون داشتن انسان برای نظارت خودروهای خود را آزمایش کنند.
میدانیم که تقویت یادگیری ، کاملا متفاوت از یادگیری ماشین و یادگیری نظارت شده و بدون نظارت است
الگوریتم های یادگیری ماشین تحت نظارت و بدون نظارت برای تجزیه و تحلیل و پیش بینی داده ها هستند
در حالی که یادگیری تقویت کننده در مورد آموزش عامل برای برقراری ارتباط با محیط زیست و به حداکثر رساندن ارزش آنها است.
بر خلاف الگوریتم های یادگیری تحت نظارت و بدون نظارت، عوامل یادگیری تقویت انگیزه ای دارند – آنها می خواهند برای رسیدن به یک هدف تلاش کنند.
این یک چشم انداز جالب است
یادگیری دستگاه با نظارت / بدون نظارت و “علم داده” را در نظر بگیرد متوجه میشوید که یک کار خسته کننده ایست چرا یک شبکه عصبی برای یادگیری در مورد داده ها در یک پایگاه داده آموزش داده می شود، زمانی که می توانید یک شبکه عصبی را برای تعامل با دنیای واقعی آموزش دهید؟
در حالی که یادگیری عمیق تقویت کننده و AI دارای توان بالقوه زیادی است، همچنین با خطر زیادی همراه است.
بیل گیتس و الن ماسک اظهارات عمومی را در مورد برخی از خطراتی که AI به ثبات اقتصادی و حتی وجود ما می بخشد، ارائه داده اند
همانطور که ما در اولین دوره تقویت یادگیری یاد دادیم ، یکی از اصول اصلی آموزش عوامل تقویت کننده یادگیری این است که در هنگام آموزش AI عواقب ناخواسته ای وجود دارد.
AI ها مانند انسان فکر نمی کنند به همین دلیل آنها راه حل های جدید و غیر شهودی برای رسیدن به اهداف خود ارائه می دهند
همانند انسان هایی که در تمامی کارهایشان بهترین هستند که این باعث تعجب کارشناسان می شود
OpenAI یک عامل بی سود که توسط الون ماسک، سام آلتمن به منظور اطمینان از اینکه AI پیشرفت می کند به طوری که مفید باشد، نه مضر. ساخته شد بخشی از انگیزه در OpenAI، خطری است که AI برای انسان ها ایجاد می کند آنها بر این باورند که همکاری باز یک کلید برای کاهش این خطرمفید است.
یکی از چیزهای بزرگ در مورد OpenAI این است که آنها یک پلت فرم به نام OpenAI Gym دارند
که ما در این دوره استفاده خواهیم کرد. این اجازه می دهد تا هر کسی در هر نقطه از جهان، عوامل تقویت کننده خود را در محیط های استاندارد را آموزش ببینند
در این دوره ما با یک محیط پیشرفته کارخواهیم کرد که توسط ، OpenAI Gym ارائه شده است :
• CartPole
• Mountain Car
• Atari games
برای آموزش عوامل موثر یادگیری، ما به تکنیک های جدید نیاز داریم.
ما با استفاده از الگوریتم TD Lambda دانش خود را درباره یادگیری تفاوت زمانی گسترش خواهیم داد
، ما به یک نوع خاص از شبکه عصبی به نام شبکه RBF نگاه خواهیم کرد
ما به روش شیب خطی نگاه می کنیم و با نگاه کردن به Q-Learning عمیق، دوره را ادامه می دهیم.

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “یادگیری عمیق reinforcement در پایتون”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

شناسه محصول: cors017 دسته: