报告人:杨洁
报告地点:腾讯会议ID:889 864 8458
报告时间:2021年06月25日星期五10:00-11:00
邀请人:徐东坡
报告摘要:
数据类间不平衡问题是大数据时代的新挑战,近几年已经吸引了越来越多的学者。报告人团队提出多种依概率密度分布的智能化上采样方法、下采样方法及混合采样方法:基于少类样本密度分布采样,抑制分类边界、强化原始数据的分布;数据降维并与高斯分布相结合,使拟合的高斯分布尾部变薄;利用分类贡献度甄别噪音点,针对每个样本最近邻进行上采样等。目前,生成对抗网络(GAN)可以生成与真实样本的概率密度分布相似的假样本,但是主要用于图像数据生成。当被用于数值型数据生成时,容易产生样点聚集的模式崩溃现象。为此,报告人团队从网络的数学本质出发,提出特征转移、在生成器中加先验、在决策器中加残差、Bagging、生成数据整型等多种策略来解决此类问题,为GAN的应用开拓了新方向。
会议密码:115119
主讲人简介:
杨洁,大连理工大学副教授,博士生导师。近五年主要进行深度学习、不平衡数据处理、人工神经网络结构稀疏化、算法构造、收敛性分析等理论研究,并将理论成果应用于芯片划痕匹配、蜂窝芯材料面型识别、医疗大数据、生物信息计算。近五年研究成果发表在多个国际顶级期刊,包括《IEEE Transactions on Neural Network and Learning Systems》(IF 8.793)、《Information Sciences》(IF 5.524)、《IEEE Transactions on Fuzzy Systems》(IF 9.518)等,其中一篇论文目前已被引36次。在研科技部重大专项子课题、辽宁省自然科学基金、上海市科技重大专项对外开放子课题三项项目。