深度学习和强化学习作为机器学习及人工智能领域的一种重要方法,目前在图像处理、对话机器人、游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。强化学习被认为是从感知智能通往认知智能的重要基石。目前不少行业已经积累了规模可观的数据,但认知智能却迟迟未见突飞猛进地发展,为进一步加强我国人工智能专业技术人才队伍建设,进一步推广人工智能与神经网络技术的应用,完善新一代信息技术支撑供给侧结构性改革的传导机制和服务平台,我公司联合邹博团队定于2022年6月举办“深度学习与强化学习技术实战”高级研修班,现将有关事宜通知如下:
参会对象
各政府、科研院所、企事业单位相关业务部门主管领导、研究人员等科技工作者;各高等院校大数据相关学科、计算机、软件、信息管理、统计、电子商务、金融、工商管理、数理统计专业等科研、教学带头教师、博士生、硕士生等,各行业数据分析相关技术爱好者。
时间地点:可咨询:13932327338 13932327338@163.com
2022年6月17日--19日 9:00-12:00 14:00-17:00 在线授课
会议目标
虽然课程坚持推导公式,但更重视系统的原理与实操;将实际工作中遇到的行业应用和痛点做最直观切实的展示;重视算法模型的同时,更强调实际问题中应该如何模型选择、特征选择和调参。
(1)快速入门并掌握Python、PyTorch、Tensorflow的编码精髓。
(2)熟悉并熟练运用各种图像识别、自然语言处理、强化学习的算法。
(3)了解现在深度学习前沿的各类算法。
授课专家
邹伟,睿客邦创始人、国内资深AI专家,擅长利用AI技术解决工业、工程中的复杂问题。华东建筑设计研究总院研究员、山东交通学院客座教授、南昌航空大学硕士生导师、上海市计划生育科学研究所特聘专家、天津大学创业导师、中国医药教育协会老年运动与健康分会学术委员;领导睿客邦与全国二十多所高校、国企建立了AI联合实验室,完成50多个深度学习实践项目,广泛应用于医疗、交通、农业、气象、银行、电信等多个领域。
参会费用
培训费用:3880元/人;费用包含会议费、资料费、授课费、增值税正式发票。
深度学习与强化学习技术实战议程
第一天
第一节:神经网络初见—直接上手搭建深度学习环境!
1.手把手教你进行深度学习环境配置(PyTorch、TF+CUDA+CuDNN +IDE安装与配置)
初识神经网络—带你掌握简单模型实现和调参!
2、多层感知机、隐藏层、激活函数
3、损失函数、模型训练和测试、训练误差、泛化误差
4、权重衰减、丢弃法、模型选择
代码验证:
房价预测
生猪价格预测
A股预测
泰坦尼克乘客存活率估计
新冠疫情确诊人数预测
第二节:卷积神经网络—打造一个人脸识别系统!
1、卷积和池化
2、特征图和感受野
3、经典卷积神经网络LeNet5、AlexNet、VGG、GoogLeNet、ResNet、DenseNet
代码验证:
智慧课堂:课堂专注度及考试作弊系统。
员工考勤系统:基于残差网络的考勤系统。
给自己设计一款美颜神器吧!
第三节:循环神经网络—你现在也是一个诗人、作词家了!
1、语言模型、n元语法
2、RNN、GRU、LSTM、双向循环
代码验证:
基于char-rnn生成周杰伦歌词
基于LSTM的唐诗,藏头诗,按需自动生成古诗。
第二天
第四节:注意力和Bert—给自己开发一个闲聊机器人吧!
1、词向量
2、注意力机制
3、Bert
代码验证:
闲聊机器人:(涉及到知识增强、句向量、检索库构建、相似度匹配、生成式聊天等技术)。
周杰伦歌曲问答系统。
豆瓣电影、书籍的知识图谱问答系统。
第五节:生成式深度学习—你也会画梵高的作品了!
1、变分自编码VAE
2、GAN网络
3、采用VAE和GAN生产图像
4、DCGAN 、CGAN
代码验证:
给自己生成一张卡通头像吧!
将一张普通的图片变成梵高风格的图片。
图片复原—将模糊的老照片变成高清无码的新照片。
第六节:走近深度学习前沿—现在深度学习在研究什么呢?
1、多任务
2、对比学习
3、知识蒸馏
代码验证:
模型太大,无法部署?来吧,教你知识蒸馏压缩模型!
当万物混合时,如何让模型学会自动分辨?
请停止你极端的侮辱!情感和仇恨的联合检测!
第三天
第七节:强化学习三大基础算法-在你自己构建的迷宫里寻宝
1、强化学习的理论基础和数学建模(马尔可夫决策模型)
2、贝尔曼方程
3、动态规划(策略迭代和值迭代)
4、蒙特卡罗(On-Policy和Off-Policy)
5、时序差分(Sarsa算法、Q-learning算法)
代码验证:
Pygame介绍
自己建一个属于自己的网格寻宝游戏!(风、陷阱)
开发一个十点半游戏吧!
第八节: DQN方法—来玩各种雅达利的游戏吧!
1、DQN方法
2、Double DQN方法
3、Dueling DQN方法
代码验证:
使用DQN玩飞翔的小鸟吧!
使用DQN玩超级玛丽吧!
使用DQN玩转俄罗斯方块!
第九节:随机策略梯度方法——打造一个炒股神器!
1、REINFORCE方法
2、PPO方法
3、Actor-Critic
4、A3C
代码验证:
基于PPO来打造一个炒股神器!
使用AC算法训练“钟摆”游戏!
使用A3C玩“超级玛丽”游戏!
第十节:博弈强化学习—开发一个ALphago五子棋!
1、博弈及博弈树
2、蒙特卡罗树搜索
3、AlphaGo的整体思路
4、AlphaGo Zero下棋原理
5、AlphaGo Zero的网络结构
代码验证:
使用ALphago的原理开发一个ALphago五子棋!