赵阳洋
发布时间: 2023-10-30 14:43:50 浏览量:
太阳成集团tyc122cc入口计算机学院研究生导师基本信息表  | 
  ||||||
1、个人基本信息:  | 
  ||||||
姓 名:赵阳洋  | 
   性 别:女  | 
   
  | 
  ||||
出生年月:1995.12  | 
   技术职称:讲师  | 
  |||||
毕业院校:华南理工大学  | 
   学历(学位):博士  | 
  |||||
所在学科:软件工程  | 
   研究方向:强化学习、大模型、人机交互  | 
  |||||
2、教育背景:  | 
  ||||||
华南理工大学大学  | 
   博士  | 
  |||||
2021.11----2022.11  | 
   Utrecht University  | 
   联合培养博士  | 
  ||||
3、 目前研究领域:  | 
  ||||||
强化学习、大模型、人机交互  | 
  ||||||
4、已完成或已在承担的主要课题:  | 
  ||||||
1、基于大模型和强化学习的任务驱动-情绪感知型对话策略研究,湖南省自然科学基金面上项目青年项目,主持,5万 2、基于端云融合的网联协同控制关键技术研究及应用,广东省重点领域研发计划项目,新一代人工智能专项,参与,10000万 3、面向在线社会网络的信息传播结构分析与宏观预测,广东省基础与应用基础研究基金,面上项目,参与,10万元 4、基于大数据分析的移动音乐智能搜索与推荐平台,广州市科技计划项目,广州市产业技术重大攻关计划-现代产业技术专题项目,参与,1400万元 5、面向移动互联网用户大数据分析及推荐平台的产业化应用,广东省应用型科技研发专项资金项目重点项目,参与,400万元  | 
  ||||||
    
 6、已发表的学术论文:  | 
  ||||||
[1] Yangyang Zhao, Jinchuan Long*, Mehdi Dastani, Shihan Wang. Rescue Conversations from Dead-ends: Efficient Exploration for Task-oriented Dialogue Policy Optimization. Transactions of the Association for Computational Linguistics, 2024. (TACL,一区TOP期刊) [2] Yangyang Zhao, Hua Qin, Zhenyu Wang, Mehdi Dastani*, Shihan Wang*. Decomposed Deep-Q Network for Efficient Dialogue Policy Learning. IEEE Trans. Audio, Speech, and Lang. Process. (TASLP,一区TOP期刊) [3]Yangyang Zhao, Ben Niu, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning for Task-oriented Dialogue through Goal Shaping. EMNLP 2024. (CCF-B) [4] Yangyang Zhao, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning: Goal Shaping for Efficient Task-oriented Dialogue Policy Learning. AAMAS 2024. (CCF-B) [5] Yangyang Zhao, Zhenyu Wang*, Zhenhua Huang. Automatic Curriculum Learning With Over-repetition Penalty for Dialogue Policy Learning. AAAI 2021. (CCF-A) [6] Yangyang Zhao, Zhenyu Wang*, Kai Yin, Rui Zhang, Zhenhua Huang, Pei Wang. Dynamic Reward-based Dueling Deep Dyna-Q: Robust Policy Learning in Noisy Environments. AAAI 2020.oral (CCF-A) [7] Yangyang Zhao, Zhenyu Wang *, Changxi Zhu, Shihan Wang. Complementary Policy Learning from Episodic Memory Policy and DQN Policy. EMNLP 2021. (CCF-B) [8] Yangyang Zhao, Hua Qin, Zhenyu Wang*, Changxi Zhu, Shihan Wang*. A Versatile Adaptive Curriculum Learning Framework for Task-oriented Dialogue Policy Learning. NAACL 2022. (CCF-B) [9] 赵阳洋,王振宇*,王佩,杨添,张睿,尹凯. 任务型对话系统研究综述. 计算机学报, 2020, 43(10): 1862-1896. (CCF-T1)  | 
  ||||||
7、 所获学术荣誉及学术影响:  | 
  ||||||
指导研究生学生获奖情况: 湖南省研究生计算机创新大赛(2024)(湖南省一等奖,优秀指导老师) 指导本科生获奖情况: 中国大学生服务外包创新大赛(2024)(全国二等奖) 中国机器人及人工智能大赛(2024)(全国二等奖) 蓝桥杯数字科技创新赛(2024)(全国三等奖) 中国大学生计算机设计大赛(2024)(中南赛区一等奖) 海峡两岸暨港澳地区大学生计算机创新作品赛(2024)(湖南省三等奖) 学术兼职: ACL, EMNLP, NAACL, COLING, AAAI,IJCAI等人工智能及自然语言处理领域顶级会议审稿人  | 
  ||||||