參會(huì)報(bào)名
會(huì)議通知
會(huì)議日程
會(huì)議嘉賓
參會(huì)指南
邀請(qǐng)函下載

首頁(yè) > 商務(wù)會(huì)議 > IT/技術(shù)會(huì)議 > 深度強(qiáng)化學(xué)習(xí)核心技術(shù)開(kāi)發(fā)與應(yīng)用研修班7月更新時(shí)間：2022-07-06T14:11:17

收藏人

分享到

深度強(qiáng)化學(xué)習(xí)核心技術(shù)開(kāi)發(fā)與應(yīng)用研修班7月已過(guò)期
推薦參加：國(guó)家軟考高級(jí)-系統(tǒng)分析師2024年線上培訓(xùn)班

會(huì)議時(shí)間：2022-07-30 09:00至 2022-08-01 18:00結(jié)束

會(huì)議地點(diǎn)：線上活動(dòng) 詳細(xì)地址會(huì)前通知

會(huì)議規(guī)模：60人

主辦單位：中國(guó)人工智能培訓(xùn)網(wǎng) 北京龍騰亞太教育咨詢(xún)有限公司

發(fā)票類(lèi)型：增值稅專(zhuān)用發(fā)票增值稅普通發(fā)票增值稅普通發(fā)票

領(lǐng)取方式：會(huì)后快遞

發(fā)票內(nèi)容：會(huì)議費(fèi) 會(huì)議服務(wù)費(fèi) 會(huì)議注冊(cè)費(fèi) 信息服務(wù)費(fèi) 技術(shù)培訓(xùn)費(fèi) 培訓(xùn)費(fèi) 技術(shù)服務(wù)費(fèi) 資料費(fèi) 咨詢(xún)費(fèi) 服務(wù)費(fèi)

參會(huì)憑證：電子票現(xiàn)場(chǎng)憑電話(huà)姓名參會(huì)

行業(yè)熱銷(xiāo)熱門(mén)關(guān)注看了又看換一換

會(huì)議通知
會(huì)議內(nèi)容主辦方介紹

深度強(qiáng)化學(xué)習(xí)核心技術(shù)開(kāi)發(fā)與應(yīng)用研修班7月宣傳圖

關(guān)于舉辦“深度強(qiáng)化學(xué)習(xí)核心技術(shù)開(kāi)發(fā)與應(yīng)用研修班”的通知

各企、事業(yè)單位：

隨著科技的快速發(fā)展,人工智能儼然成了當(dāng)今社會(huì)的關(guān)注焦點(diǎn)。而在人工智能的發(fā)展上,深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等成為了科學(xué)界、工業(yè)界研究和應(yīng)用的熱點(diǎn)。在實(shí)際研究和應(yīng)用過(guò)程當(dāng)中，研究人員逐漸發(fā)現(xiàn)了深度學(xué)習(xí)單獨(dú)應(yīng)用的缺點(diǎn)，如沒(méi)有決策能力，不可推理等。而深度強(qiáng)化學(xué)習(xí)，作為一種嶄新的機(jī)器學(xué)習(xí)方法,同時(shí)具有感知能力和決策能力，它是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的結(jié)合，二者的結(jié)合涵蓋眾多算法、規(guī)則、框架,并廣泛應(yīng)用于機(jī)器人、無(wú)人機(jī)、無(wú)人車(chē)、無(wú)人艇、兵棋推演、自動(dòng)駕駛、能源分配、編隊(duì)控制、航跡規(guī)劃、路由規(guī)劃等眾多領(lǐng)域，具有極高的研究與應(yīng)用價(jià)值。

為積極響應(yīng)科研及工作人員需求，根據(jù)國(guó)務(wù)院《國(guó)家中長(zhǎng)期人才發(fā)展規(guī)劃綱要（2010-2020年）》和人社部《專(zhuān)業(yè)技術(shù)人才知識(shí)更新工程實(shí)施方案（2010-2020年）》文件精神，中國(guó)管理科學(xué)研究院現(xiàn)代教育研究所聯(lián)合北京龍騰亞太教育咨詢(xún)有限公司特舉辦“深度強(qiáng)化學(xué)習(xí)核心技術(shù)開(kāi)發(fā)與應(yīng)用研修班”。本次培訓(xùn)采用全實(shí)戰(zhàn)培訓(xùn)模式。

主辦單位：中國(guó)管理科學(xué)研究院現(xiàn)代教育研究所

承辦單位：北京龍騰亞太教育咨詢(xún)有限公司、北京新鼎聚成文化傳媒有限公司

注：發(fā)票由具體承辦單位開(kāi)具。

一、培訓(xùn)專(zhuān)家:

中國(guó)科學(xué)院計(jì)算技術(shù)研究所、清華大學(xué)、北京理工大學(xué)等科研機(jī)構(gòu)和大學(xué)的高級(jí)專(zhuān)家，擁有豐富的科研及工程技術(shù)經(jīng)驗(yàn)，長(zhǎng)期從事人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、大數(shù)據(jù)分析等領(lǐng)域的教學(xué)與研究工作。

二、時(shí)間安排: ????????????????2022年7月29日-8月01日 ????線上直播

? ? ? ? ? ? ? ? ? ? ? ? ? ?（29日下發(fā)上課所需材料，7月30日-8月1日全天上課）

中國(guó)管理科學(xué)研究院現(xiàn)代教育研究所 ?????????????北京龍騰亞太教育咨詢(xún)有限公司

??????二〇二二年五月二十八日??????????????????????二〇二二年五月二十八日

三、參會(huì)對(duì)象：

各省市、自治區(qū)從事人工智能、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、無(wú)人機(jī)、無(wú)人艇、無(wú)人車(chē)、機(jī)器人、智能體、多智能體、兵棋推演、自動(dòng)駕駛、能源分配、編隊(duì)控制、航跡規(guī)劃、路由規(guī)劃等領(lǐng)域相關(guān)的企事業(yè)單位技術(shù)骨干、科研院所研究人員和大專(zhuān)院校相關(guān)專(zhuān)業(yè)教學(xué)人員及在校研究生等相關(guān)人員，以及強(qiáng)化學(xué)習(xí)、人工智能廣大愛(ài)好者。

四、培訓(xùn)目標(biāo)：

1、了解強(qiáng)化學(xué)習(xí)發(fā)展。

2、掌握單智能體深度強(qiáng)化學(xué)習(xí)。

3、掌握多智能體深度強(qiáng)化學(xué)習(xí)。

4、掌握多任務(wù)深度強(qiáng)化學(xué)習(xí)。

5、掌握強(qiáng)化學(xué)習(xí)應(yīng)用領(lǐng)域Gym Retro游戲平臺(tái)、機(jī)器人控制、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理。

6、實(shí)現(xiàn)Gym、Ray仿真環(huán)境。

7、實(shí)際體驗(yàn)Q Learning實(shí)驗(yàn)、DQN實(shí)驗(yàn)、DDPG實(shí)驗(yàn)。

五、費(fèi)用標(biāo)準(zhǔn)：

1、4580元/人（含報(bào)名費(fèi)、培訓(xùn)費(fèi)、資料費(fèi)、證書(shū)費(fèi)）。

2、培訓(xùn)費(fèi)由組織培訓(xùn)班的施教機(jī)構(gòu)負(fù)責(zé)收取并提供培訓(xùn)發(fā)票。

3、報(bào)名成功后于一周內(nèi)辦理匯款手續(xù)。

4、報(bào)名5人以上可享受9折優(yōu)惠。

5、參加線上培訓(xùn)學(xué)員可享受視頻錄播回放權(quán)益，及本人再次免費(fèi)參加線下學(xué)習(xí)權(quán)益。

六、頒發(fā)證書(shū)：

參加相關(guān)培訓(xùn)并通過(guò)考核的學(xué)員，由中國(guó)管理科學(xué)研究院現(xiàn)代教育研究所頒發(fā)《深度強(qiáng)化學(xué)習(xí)開(kāi)發(fā)與應(yīng)用工程師》（高級(jí)）崗位認(rèn)證證書(shū)，可通過(guò)官方網(wǎng)站查詢(xún) ，該證書(shū)可作為有關(guān)單位專(zhuān)業(yè)技術(shù)人員能力評(píng)價(jià)、考核和任職的重要依據(jù)。

注：請(qǐng)學(xué)員將電子版彩照（大于20KB，紅藍(lán)底皆可）、身份證復(fù)印件和學(xué)歷證明復(fù)印件?

七、注意事項(xiàng)

1、指定報(bào)名郵箱?

2、報(bào)名成功后，會(huì)務(wù)組在上課前兩天發(fā)放上課所需所有材料。

3、學(xué)員需自備電腦一臺(tái)，配置win10、64位系統(tǒng)、8G內(nèi)存、100G硬盤(pán)。

附件1：具體課程安排

時(shí)間安排

大 ?綱

具體內(nèi)容

實(shí)操案例

三天

關(guān)鍵點(diǎn)

1.強(qiáng)化學(xué)習(xí)的發(fā)展歷程

2.馬爾可夫決策過(guò)程

3.動(dòng)態(tài)規(guī)劃

4.無(wú)模型預(yù)測(cè)學(xué)習(xí)

5.無(wú)模型控制學(xué)習(xí)

6.價(jià)值函數(shù)逼近

7.策略梯度方法

8.深度強(qiáng)化學(xué)習(xí)-DQN算法系列

9.深度策略梯度-DDPG,PPO等

第一天

9:00-12:00

14:00-17:00

一、強(qiáng)化學(xué)習(xí)概述

1.強(qiáng)化學(xué)習(xí)介紹???????2.強(qiáng)化學(xué)習(xí)與其它機(jī)器學(xué)習(xí)的不同

3.強(qiáng)化學(xué)習(xí)發(fā)展歷史???4.強(qiáng)化學(xué)習(xí)典型應(yīng)用

5.強(qiáng)化學(xué)習(xí)基本元素???6.強(qiáng)化學(xué)習(xí)算法分類(lèi)

二、馬爾科夫決策過(guò)程

1.馬爾可夫性?????????2.馬爾可夫決策過(guò)程

3.策略與價(jià)值?????????4.最優(yōu)化原理

5.MDPs擴(kuò)展

三、動(dòng)態(tài)規(guī)劃

1.動(dòng)態(tài)規(guī)劃???????2.價(jià)值迭代

3.策略迭代???????4.迭代策略評(píng)估

5.廣義策略迭代???6.維數(shù)災(zāi)

1.python環(huán)境下簡(jiǎn)單掃地機(jī)器人環(huán)境

2.價(jià)值迭代python實(shí)現(xiàn)

3.策略迭代python實(shí)現(xiàn)

4.迭代策略評(píng)估python實(shí)現(xiàn)

四、無(wú)模型預(yù)測(cè)學(xué)習(xí)

1.蒙特卡洛方法???2.時(shí)間差分學(xué)習(xí)

3.n-步回報(bào)???????4.TD(lambda)

5.資格跡

1.蒙特卡洛方法python實(shí)現(xiàn)

2.時(shí)間差分方法python實(shí)現(xiàn)

第二天

9:00-12:00

14:00-17:00

五、無(wú)模型控制學(xué)習(xí)

1.蒙特卡洛控制???2.Sarsa

3.重要性采樣?????4.Q-學(xué)習(xí)

4.Double Q學(xué)習(xí)???5.探索與利用

1. Sarsa方法python實(shí)現(xiàn)

2. Q學(xué)習(xí)方法python實(shí)現(xiàn)

3. Sarsa(lambda)方法python實(shí)現(xiàn)

六、價(jià)值函數(shù)逼近

1.函數(shù)逼近器?????2.線性函數(shù)逼近

3.常見(jiàn)的特征表示方法

4.價(jià)值迭代+離散化方法

5.Fitted Q Iteration

6.策略迭代+最小二乘

7.預(yù)測(cè)學(xué)習(xí)+隨機(jī)梯度下降法

8.控制學(xué)習(xí)+隨機(jī)梯度下降法

1. 離散化Q迭代方法python實(shí)現(xiàn)

2. LSPI方法python實(shí)現(xiàn)

七、策略梯度方法

1.基于策略的強(qiáng)化學(xué)習(xí)

2.有限差分策略梯度

3.解析法策略梯度

4.REINFORCE算法

5.Actor-Critic

6.策略梯度引入基準(zhǔn)

7.自然梯度

8.確定型Actor-Critic

1. 策略迭代方法python實(shí)現(xiàn)

2. actor-critic方法python實(shí)現(xiàn)

第三天

9:00-12:00

14:00-17:00

八、深度強(qiáng)化學(xué)習(xí)

1.Deep?Q learning(DQN)

2.Double DQN

3.Dueling DQN

4.Prioritized Experience Replay

5.A3C/A2C

6.DDPG

7.PPO

8.SAC

1.深度強(qiáng)化學(xué)習(xí)訓(xùn)練場(chǎng)-OpenAI Gym?安裝與使用

2.Pytorch安裝與使用

3.自動(dòng)駕駛賽車(chē)任務(wù)

4.月球飛船降落任務(wù)

實(shí)操解析與訓(xùn)練一

實(shí)驗(yàn)：倒立擺和冰壺控制實(shí)踐

1.環(huán)境編寫(xiě) ???2.算法設(shè)計(jì) ???3.實(shí)驗(yàn)結(jié)果

高頻問(wèn)題：

如何將一個(gè)控制問(wèn)題設(shè)計(jì)成馬爾可夫決策問(wèn)題并使用強(qiáng)化學(xué)習(xí)算法進(jìn)行訓(xùn)練

關(guān)鍵點(diǎn)：

1.基于模型的離線強(qiáng)化學(xué)習(xí)方法 ???2.基于數(shù)據(jù)的在線強(qiáng)化學(xué)習(xí)方法

實(shí)操解析與訓(xùn)練二

實(shí)驗(yàn)：OpenAI Gym實(shí)踐

1.Gym安裝 ??2.Gym使用 ??3.強(qiáng)化學(xué)習(xí)

高頻問(wèn)題：

1.如何基于Gym實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)訓(xùn)練與測(cè)試

關(guān)鍵點(diǎn)：

1.掌握馬爾可夫決策過(guò)程 ??????2.低維輸入的強(qiáng)化學(xué)習(xí)方法

實(shí)操解析與訓(xùn)練三

實(shí)驗(yàn)：月球飛船降落任務(wù)

1.DQN/Double?DQN/Dueling?DQN????????2.PER

高頻問(wèn)題：

1.深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練穩(wěn)定性 ??2.探索與利用

關(guān)鍵點(diǎn)：

1.經(jīng)驗(yàn)回放技術(shù)的實(shí)現(xiàn) ????2.目標(biāo)網(wǎng)絡(luò)更新

實(shí)操解析與訓(xùn)練四

實(shí)驗(yàn)：自動(dòng)駕駛賽車(chē)任務(wù)

1.連續(xù)控制任務(wù) ??2.策略梯度方法DDPG/PPO

高頻問(wèn)題：

1.適用于高維輸入的連續(xù)控制任務(wù)的深度強(qiáng)化學(xué)習(xí)方法

關(guān)鍵點(diǎn)：

1.掌握DDPG和PPO具體編程實(shí)現(xiàn) ???

2.根據(jù)實(shí)際需求，選用合理的深度強(qiáng)化學(xué)習(xí)方法

中國(guó)人工智能培訓(xùn)網(wǎng)

北京龍騰亞太教育咨詢(xún)有限公司

會(huì)議日程

即將更新，敬請(qǐng)期待

會(huì)議嘉賓

即將更新，敬請(qǐng)期待

參會(huì)指南
會(huì)議門(mén)票

票種名稱(chēng)	價(jià)格	原價(jià)	票價(jià)說(shuō)明
早鳥(niǎo)價(jià)	￥4580	￥4580	講課費(fèi)，資料費(fèi)，證書(shū)費(fèi)，平臺(tái)費(fèi)，售后服務(wù)費(fèi)

溫馨提示
酒店與住宿: 為防止極端情況下活動(dòng)延期或取消，建議“異地客戶(hù)”與活動(dòng)家客服確認(rèn)參會(huì)信息后，再安排出行與住宿。
退款規(guī)則: 活動(dòng)各項(xiàng)資源需提前采購(gòu)，購(gòu)票后不支持退款，可以換人參加。

標(biāo)簽：深度學(xué)習(xí)

您可能還會(huì)關(guān)注

活動(dòng)家為本會(huì)議官方合作
報(bào)名平臺(tái)，您可在線購(gòu)票

會(huì)議支持：

會(huì)員折扣
該會(huì)議支持會(huì)員折扣
具體折扣標(biāo)準(zhǔn)請(qǐng)參見(jiàn)plus會(huì)員頁(yè)面
會(huì)員返積分
每消費(fèi)1元累積1個(gè)會(huì)員積分。
僅PC站支持。
會(huì)員積分抵現(xiàn)
根據(jù)會(huì)員等級(jí)的不同，每抵用1元可使用的積分也不一樣，具體可參見(jiàn)PLUS會(huì)員頁(yè)面。僅PC站支持。

部分參會(huì)單位

主辦方?jīng)]有公開(kāi)參會(huì)單位

郵件提醒通知

深度強(qiáng)化學(xué)習(xí)核心技術(shù)開(kāi)發(fā)與應(yīng)用研修班7月

深度強(qiáng)化學(xué)習(xí)核心技術(shù)開(kāi)發(fā)與應(yīng)用研修班7月 已過(guò)期 推薦參加：國(guó)家軟考高級(jí)-系統(tǒng)分析師2024年線上培訓(xùn)班

會(huì)議通知 會(huì)議內(nèi)容 主辦方介紹

會(huì)議日程

會(huì)議嘉賓

參會(huì)指南 會(huì)議門(mén)票

您可能還會(huì)關(guān)注

錄入信息

請(qǐng)先登錄

深度強(qiáng)化學(xué)習(xí)核心技術(shù)開(kāi)發(fā)與應(yīng)用研修班7月已過(guò)期
推薦參加：國(guó)家軟考高級(jí)-系統(tǒng)分析師2024年線上培訓(xùn)班

會(huì)議通知
會(huì)議內(nèi)容主辦方介紹

參會(huì)指南
會(huì)議門(mén)票