• 參會(huì )報名
  • 會(huì )議通知
  • 會(huì )議日程
  • 會(huì )議嘉賓
  • 參會(huì )指南
  • 邀請函下載

首頁(yè) > 商務(wù)會(huì )議 > IT/技術(shù)會(huì )議 > 深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用研修班7月 更新時(shí)間:2022-07-06T14:11:17

深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用研修班7月
收藏人
分享到

深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用研修班7月 已過(guò)期

會(huì )議時(shí)間:2022-07-30 09:00至 2022-08-01 18:00結束

會(huì )議地點(diǎn): 線(xiàn)上活動(dòng)  詳細地址會(huì )前通知  

會(huì )議規模:60人

主辦單位: 中國人工智能培訓網(wǎng) 北京龍騰亞太教育咨詢(xún)有限公司

發(fā)票類(lèi)型:增值稅專(zhuān)用發(fā)票 增值稅普通發(fā)票 增值稅普通發(fā)票
領(lǐng)取方式:會(huì )后快遞 
發(fā)票內容: 會(huì )議費 會(huì )議服務(wù)費 會(huì )議注冊費 信息服務(wù)費 技術(shù)培訓費 培訓費 技術(shù)服務(wù)費 資料費 咨詢(xún)費 服務(wù)費 
參會(huì )憑證:電子票 現場(chǎng)憑電話(huà)姓名參會(huì )

行業(yè)熱銷(xiāo)熱門(mén)關(guān)注看了又看 換一換

        會(huì )議通知

        會(huì )議內容 主辦方介紹


        深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用研修班7月

        深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用研修班7月宣傳圖

        關(guān)于舉辦“深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用研修班”的通知

        各企、事業(yè)單位:

        隨著(zhù)科技的快速發(fā)展,人工智能儼然成了當今社會(huì )的關(guān)注焦點(diǎn)。而在人工智能的發(fā)展上,深度學(xué)習、強化學(xué)習、遷移學(xué)習等成為了科學(xué)界、工業(yè)界研究和應用的熱點(diǎn)。在實(shí)際研究和應用過(guò)程當中,研究人員逐漸發(fā)現了深度學(xué)習單獨應用的缺點(diǎn),如沒(méi)有決策能力,不可推理等。而深度強化學(xué)習,作為一種嶄新的機器學(xué)習方法,同時(shí)具有感知能力和決策能力,它是深度學(xué)習與強化學(xué)習的結合,二者的結合涵蓋眾多算法、規則、框架,并廣泛應用于機器人、無(wú)人機、無(wú)人車(chē)、無(wú)人艇、兵棋推演、自動(dòng)駕駛、能源分配、編隊控制、航跡規劃、路由規劃等眾多領(lǐng)域,具有極高的研究與應用價(jià)值。

        為積極響應科研及工作人員需求,根據國務(wù)院《國家中長(cháng)期人才發(fā)展規劃綱要(2010-2020年)》和人社部《專(zhuān)業(yè)技術(shù)人才知識更新工程實(shí)施方案(2010-2020年)》文件精神,中國管理科學(xué)研究院現代教育研究所 聯(lián)合北京龍騰亞太教育咨詢(xún)有限公司特舉辦“深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用研修班”。本次培訓采用全實(shí)戰培訓模式。

        主辦單位:中國管理科學(xué)研究院現代教育研究所

        承辦單位:北京龍騰亞太教育咨詢(xún)有限公司、北京新鼎聚成文化傳媒有限公司

        注:發(fā)票由具體承辦單位開(kāi)具。

        一、培訓專(zhuān)家:

        中國科學(xué)院計算技術(shù)研究所、清華大學(xué)、北京理工大學(xué)等科研機構和大學(xué)的高級專(zhuān)家,擁有豐富的科研及工程技術(shù)經(jīng)驗,長(cháng)期從事人工智能、機器學(xué)習、深度學(xué)習、大數據分析等領(lǐng)域的教學(xué)與研究工作。

        二、時(shí)間安排: ????????????????2022年7月29日-8月01日 ????線(xiàn)上直播

        ? ? ? ? ? ? ? ? ? ? ? ? ? ?(29日下發(fā)上課所需材料,7月30日-8月1日全天上課)


        中國管理科學(xué)研究院現代教育研究所 ?????????????北京龍騰亞太教育咨詢(xún)有限公司

        ??????二〇二二年五月二十八日??????????????????????二〇二二年五月二十八日

        三、參會(huì )對象:

        各省市、自治區從事人工智能、機器學(xué)習、計算機視覺(jué)、自然語(yǔ)言處理、無(wú)人機、無(wú)人艇、無(wú)人車(chē)、機器人、智能體、多智能體、兵棋推演、自動(dòng)駕駛、能源分配、編隊控制、航跡規劃、路由規劃等領(lǐng)域相關(guān)的企事業(yè)單位技術(shù)骨干、科研院所研究人員和大專(zhuān)院校相關(guān)專(zhuān)業(yè)教學(xué)人員及在校研究生等相關(guān)人員,以及強化學(xué)習、人工智能廣大愛(ài)好者。

        四、培訓目標:

        1、了解強化學(xué)習發(fā)展。

        2、掌握單智能體深度強化學(xué)習。

        3、掌握多智能體深度強化學(xué)習。

        4、掌握多任務(wù)深度強化學(xué)習。

        5、掌握強化學(xué)習應用領(lǐng)域Gym Retro游戲平臺、機器人控制、計算機視覺(jué)、自然語(yǔ)言處理。

        6、實(shí)現Gym、Ray仿真環(huán)境。

        7、實(shí)際體驗Q Learning實(shí)驗、DQN實(shí)驗、DDPG實(shí)驗。

        五、費用標準:

        1、4580元/人(含報名費、培訓費、資料費、證書(shū)費)。

        2、培訓費由組織培訓班的施教機構負責收取并提供培訓發(fā)票。

        3、報名成功后于一周內辦理匯款手續。

        4、報名5人以上可享受9折優(yōu)惠。

        5、參加線(xiàn)上培訓學(xué)員可享受視頻錄播回放權益,及本人再次免費參加線(xiàn)下學(xué)習權益。

        六、頒發(fā)證書(shū):

        參加相關(guān)培訓并通過(guò)考核的學(xué)員,由中國管理科學(xué)研究院現代教育研究所頒發(fā)《深度強化學(xué)習開(kāi)發(fā)與應用工程師》(高級)崗位認證證書(shū),可通過(guò)官方網(wǎng)站查詢(xún) ,該證書(shū)可作為有關(guān)單位專(zhuān)業(yè)技術(shù)人員能力評價(jià)、考核和任職的重要依據。

        注:請學(xué)員將電子版彩照(大于20KB,紅藍底皆可)、身份證復印件和學(xué)歷證明復印件?

        七、注意事項

        1、指定報名郵箱?

        2、報名成功后,會(huì )務(wù)組在上課前兩天發(fā)放上課所需所有材料。

        3、學(xué)員需自備電腦一臺,配置win10、64位系統、8G內存、100G硬盤(pán)。

        附件1:具體課程安排

        時(shí)間安排

        大 ?綱

        具體內容

        實(shí)操案例

        三天

        關(guān)鍵點(diǎn)

        1.強化學(xué)習的發(fā)展歷程

        2.馬爾可夫決策過(guò)程

        3.動(dòng)態(tài)規劃

        4.無(wú)模型預測學(xué)習

        5.無(wú)模型控制學(xué)習

        6.價(jià)值函數逼近

        7.策略梯度方法

        8.深度強化學(xué)習-DQN算法系列

        9.深度策略梯度-DDPG,PPO等

        第一天

        9:00-12:00

        14:00-17:00

        一、強化學(xué)習概述

        1.強化學(xué)習介紹???????2.強化學(xué)習與其它機器學(xué)習的不同

        3.強化學(xué)習發(fā)展歷史???4.強化學(xué)習典型應用

        5.強化學(xué)習基本元素???6.強化學(xué)習算法分類(lèi)

        二、馬爾科夫決策過(guò)程

        1.馬爾可夫性?????????2.馬爾可夫決策過(guò)程

        3.策略與價(jià)值?????????4.最優(yōu)化原理

        5.MDPs擴展

        三、動(dòng)態(tài)規劃

        1.動(dòng)態(tài)規劃???????2.價(jià)值迭代

        3.策略迭代???????4.迭代策略評估

        5.廣義策略迭代???6.維數災

        1.python環(huán)境下簡(jiǎn)單掃地機器人環(huán)境

        2.價(jià)值迭代python實(shí)現

        3.策略迭代python實(shí)現

        4.迭代策略評估python實(shí)現

        四、無(wú)模型預測學(xué)習

        1.蒙特卡洛方法???2.時(shí)間差分學(xué)習

        3.n-步回報???????4.TD(lambda)

        5.資格跡

        1.蒙特卡洛方法python實(shí)現

        2.時(shí)間差分方法python實(shí)現

        第二天

        9:00-12:00

        14:00-17:00

        、無(wú)模型控制學(xué)習

        1.蒙特卡洛控制???2.Sarsa

        3.重要性采樣?????4.Q-學(xué)習

        4.Double Q學(xué)習???5.探索與利用

        1. Sarsa方法python實(shí)現

        2. Q學(xué)習方法python實(shí)現

        3. Sarsa(lambda)方法python實(shí)現

        六、價(jià)值函數逼近

        1.函數逼近器?????2.線(xiàn)性函數逼近

        3.常見(jiàn)的特征表示方法

        4.價(jià)值迭代+離散化方法

        5.Fitted Q Iteration

        6.策略迭代+最小二乘

        7.預測學(xué)習+隨機梯度下降法

        8.控制學(xué)習+隨機梯度下降法

        1. 離散化Q迭代方法python實(shí)現

        2. LSPI方法python實(shí)現

        、策略梯度方法

        1.基于策略的強化學(xué)習

        2.有限差分策略梯度

        3.解析法策略梯度

        4.REINFORCE算法

        5.Actor-Critic

        6.策略梯度引入基準

        7.自然梯度

        8.確定型Actor-Critic

        1. 策略迭代方法python實(shí)現

        2. actor-critic方法python實(shí)現

        第三天

        9:00-12:00

        14:00-17:00

        、深度強化學(xué)習

        1.Deep?Q learning(DQN)

        2.Double DQN

        3.Dueling DQN

        4.Prioritized Experience Replay

        5.A3C/A2C

        6.DDPG

        7.PPO

        8.SAC

        1.深度強化學(xué)習訓練場(chǎng)-OpenAI Gym?安裝與使用

        2.Pytorch安裝與使用

        3.自動(dòng)駕駛賽車(chē)任務(wù)

        4.月球飛船降落任務(wù)

        實(shí)操解析與訓練一

        實(shí)驗:倒立擺和冰壺控制實(shí)踐

        1.環(huán)境編寫(xiě) ???2.算法設計 ???3.實(shí)驗結果

        高頻問(wèn)題:

        如何將一個(gè)控制問(wèn)題設計成馬爾可夫決策問(wèn)題并使用強化學(xué)習算法進(jìn)行訓練

        關(guān)鍵點(diǎn):

        1.基于模型的離線(xiàn)強化學(xué)習方法 ???2.基于數據的在線(xiàn)強化學(xué)習方法

        實(shí)操解析與訓練二

        實(shí)驗:OpenAI Gym實(shí)踐

        1.Gym安裝 ??2.Gym使用 ??3.強化學(xué)習

        高頻問(wèn)題:

        1.如何基于Gym實(shí)現強化學(xué)習訓練與測試

        關(guān)鍵點(diǎn):

        1.掌握馬爾可夫決策過(guò)程 ??????2.低維輸入的強化學(xué)習方法

        實(shí)操解析與訓練三

        實(shí)驗:月球飛船降落任務(wù)

        1.DQN/Double?DQN/Dueling?DQN????????2.PER

        高頻問(wèn)題

        1.深度強化學(xué)習網(wǎng)絡(luò )訓練穩定性 ??2.探索與利用

        關(guān)鍵點(diǎn):

        1.經(jīng)驗回放技術(shù)的實(shí)現 ????2.目標網(wǎng)絡(luò )更新

        實(shí)操解析與訓練四

        實(shí)驗:自動(dòng)駕駛賽車(chē)任務(wù)

        1.連續控制任務(wù) ??2.策略梯度方法DDPG/PPO

        高頻問(wèn)題:

        1.適用于高維輸入的連續控制任務(wù)的深度強化學(xué)習方法

        關(guān)鍵點(diǎn):

        1.掌握DDPG和PPO具體編程實(shí)現 ???

        2.根據實(shí)際需求,選用合理的深度強化學(xué)習方法


        ?



        查看更多

        會(huì )議日程


        即將更新,敬請期待

        會(huì )議嘉賓


        即將更新,敬請期待

        參會(huì )指南

        會(huì )議門(mén)票


        票種名稱(chēng) 價(jià)格 原價(jià) 票價(jià)說(shuō)明
        早鳥(niǎo)價(jià) ¥4580 ¥4580 講課費,資料費,證書(shū)費,平臺費,售后服務(wù)費

        查看更多

        溫馨提示
        酒店與住宿: 為防止極端情況下活動(dòng)延期或取消,建議“異地客戶(hù)”與活動(dòng)家客服確認參會(huì )信息后,再安排出行與住宿。
        退款規則: 活動(dòng)各項資源需提前采購,購票后不支持退款,可以換人參加。

        活動(dòng)家為本會(huì )議官方合作
        報名平臺,您可在線(xiàn)購票

        會(huì )議支持:

        • 會(huì )員折扣
          該會(huì )議支持會(huì )員折扣
          具體折扣標準請參見(jiàn)plus會(huì )員頁(yè)面
        • 會(huì )員返積分
          每消費1元累積1個(gè)會(huì )員積分。
          僅PC站支持。
        • 會(huì )員積分抵現
          根據會(huì )員等級的不同,每抵用1元可使用的積分也不一樣,具體可參見(jiàn)PLUS會(huì )員頁(yè)面。 僅PC站支持。

        部分參會(huì )單位

        主辦方?jīng)]有公開(kāi)參會(huì )單位

        郵件提醒通知

        分享到微信 ×

        打開(kāi)微信,點(diǎn)擊底部的“發(fā)現”,
        使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。

        錄入信息

        請錄入信息,方便生成邀請函