NT 590 特價中
在本課程中將學習並實現一種新的令人難以置信的聰明的人工智慧模型,稱為雙延遲 DDPG( Twin-Delayed DDPG ),它結合了人工智慧領域的最新技術,包括連續雙深度 Q 學習( Double Deep Q-Learning )、政策梯度( Policy Gradient )和 Actor Critic。 這個模型是如此強大,以至於在我們的課程中,我們第一次能夠解決最具挑戰性的虛擬人工智慧應用程式(訓練一隻螞蟻 / 蜘蛛和一個半人形機器人在田野中行走和奔跑)。
https://softnshare.com/deep-reinforcement-learning/
「reinforcement learning q-learning」的推薦目錄:
reinforcement learning q-learning 在 軟體開發學習資訊分享 Facebook 的最佳貼文
在人工智慧的世界裡,強化學習毫無疑問是最有前途、發展最快的技術之一!
這堂課將教你學習使用 Python,Pytorch 和 OpenAI Gym 應用強化學習(reinforcement)和人工智慧演算法
從這 7 小時的課程,你會學到
1. 強化學習基礎
2. Tabular 方法
貝爾曼(Bellman)方程
3. Q Learning
4. 深度強化學習
5. 從視訊輸入中學習
>本課程所有的程式碼和安裝說明都已更新並經過驗證可以使用 Pytorch 1.0。
https://softnshare.com/reinforcement-learning-with-pytorch/