专栏文章

关于举办“深度学习与强化学习技术实战”高级研修班的通知

wwwwww 2022-05-17

（1）快速入门并掌握Python、PyTorch、Tensorflow的编码精髓。（2）熟悉并熟练运用各种图像识别、自然语言处理、强化学习的算法。（3）了解现在深度学习前沿的各类算法。

深度学习和强化学习作为机器学习及人工智能领域的一种重要方法，目前在图像处理、对话机器人、游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。强化学习被认为是从感知智能通往认知智能的重要基石。目前不少行业已经积累了规模可观的数据，但认知智能却迟迟未见突飞猛进地发展，为进一步加强我国人工智能专业技术人才队伍建设，进一步推广人工智能与神经网络技术的应用，完善新一代信息技术支撑供给侧结构性改革的传导机制和服务平台，我公司联合邹博团队定于2022年6月举办“深度学习与强化学习技术实战”高级研修班，现将有关事宜通知如下：

参会对象

各政府、科研院所、企事业单位相关业务部门主管领导、研究人员等科技工作者；各高等院校大数据相关学科、计算机、软件、信息管理、统计、电子商务、金融、工商管理、数理统计专业等科研、教学带头教师、博士生、硕士生等，各行业数据分析相关技术爱好者。

时间地点：可咨询：13932327338 13932327338@163.com

2022年6月17日--19日 9:00-12:00 14:00-17:00 在线授课

会议目标

虽然课程坚持推导公式，但更重视系统的原理与实操；将实际工作中遇到的行业应用和痛点做最直观切实的展示；重视算法模型的同时，更强调实际问题中应该如何模型选择、特征选择和调参。

（1）快速入门并掌握Python、PyTorch、Tensorflow的编码精髓。

（2）熟悉并熟练运用各种图像识别、自然语言处理、强化学习的算法。

（3）了解现在深度学习前沿的各类算法。

授课专家

邹伟，睿客邦创始人、国内资深AI专家，擅长利用AI技术解决工业、工程中的复杂问题。华东建筑设计研究总院研究员、山东交通学院客座教授、南昌航空大学硕士生导师、上海市计划生育科学研究所特聘专家、天津大学创业导师、中国医药教育协会老年运动与健康分会学术委员；领导睿客邦与全国二十多所高校、国企建立了AI联合实验室，完成50多个深度学习实践项目，广泛应用于医疗、交通、农业、气象、银行、电信等多个领域。

参会费用

培训费用：3880元/人；费用包含会议费、资料费、授课费、增值税正式发票。

深度学习与强化学习技术实战议程

第一天

第一节：神经网络初见—直接上手搭建深度学习环境！

1.手把手教你进行深度学习环境配置（PyTorch、TF+CUDA+CuDNN +IDE安装与配置）

初识神经网络—带你掌握简单模型实现和调参！

2、多层感知机、隐藏层、激活函数

3、损失函数、模型训练和测试、训练误差、泛化误差

4、权重衰减、丢弃法、模型选择

代码验证：

房价预测
生猪价格预测
A股预测
泰坦尼克乘客存活率估计
新冠疫情确诊人数预测

第二节:卷积神经网络—打造一个人脸识别系统！

1、卷积和池化

2、特征图和感受野

3、经典卷积神经网络LeNet5、AlexNet、VGG、GoogLeNet、ResNet、DenseNet

代码验证：

智慧课堂：课堂专注度及考试作弊系统。
员工考勤系统：基于残差网络的考勤系统。
给自己设计一款美颜神器吧！

第三节：循环神经网络—你现在也是一个诗人、作词家了!

1、语言模型、n元语法

2、RNN、GRU、LSTM、双向循环

代码验证：

基于char-rnn生成周杰伦歌词
基于LSTM的唐诗，藏头诗，按需自动生成古诗。

第二天

第四节：注意力和Bert—给自己开发一个闲聊机器人吧！

1、词向量

2、注意力机制

3、Bert

代码验证：

闲聊机器人：（涉及到知识增强、句向量、检索库构建、相似度匹配、生成式聊天等技术）。
周杰伦歌曲问答系统。
豆瓣电影、书籍的知识图谱问答系统。

第五节：生成式深度学习—你也会画梵高的作品了！

1、变分自编码VAE

2、GAN网络

3、采用VAE和GAN生产图像

4、DCGAN 、CGAN

代码验证：

给自己生成一张卡通头像吧！
将一张普通的图片变成梵高风格的图片。
图片复原—将模糊的老照片变成高清无码的新照片。

第六节：走近深度学习前沿—现在深度学习在研究什么呢？

1、多任务

2、对比学习

3、知识蒸馏

代码验证：

模型太大，无法部署？来吧，教你知识蒸馏压缩模型！
当万物混合时，如何让模型学会自动分辨？
请停止你极端的侮辱！情感和仇恨的联合检测！

第三天

第七节：强化学习三大基础算法-在你自己构建的迷宫里寻宝

1、强化学习的理论基础和数学建模（马尔可夫决策模型）

2、贝尔曼方程

3、动态规划（策略迭代和值迭代）

4、蒙特卡罗（On-Policy和Off-Policy）

5、时序差分（Sarsa算法、Q-learning算法）

代码验证：

Pygame介绍
自己建一个属于自己的网格寻宝游戏！（风、陷阱）
开发一个十点半游戏吧！

第八节： DQN方法—来玩各种雅达利的游戏吧！

1、DQN方法

2、Double DQN方法

3、Dueling DQN方法

代码验证：

使用DQN玩飞翔的小鸟吧！
使用DQN玩超级玛丽吧!
使用DQN玩转俄罗斯方块！

第九节：随机策略梯度方法——打造一个炒股神器！

1、REINFORCE方法

2、PPO方法

3、Actor-Critic

4、A3C

代码验证：

基于PPO来打造一个炒股神器！
使用AC算法训练“钟摆”游戏！
使用A3C玩“超级玛丽”游戏！

第十节：博弈强化学习—开发一个ALphago五子棋！

1、博弈及博弈树

2、蒙特卡罗树搜索

3、AlphaGo的整体思路

4、AlphaGo Zero下棋原理

5、AlphaGo Zero的网络结构

代码验证：

使用ALphago的原理开发一个ALphago五子棋！

版权归作者所有，转载请注明出处

wwwwww 关注

热度 0

LOFTER-网易轻博