【优博育苗展】北理工光电学院李佳男博士荣获:2018年度博士育苗基金
研究课题
深度学习框架下的目标检测方法研究
研究内容及创新点
论文在调研分析国内外目标检测方法和关键技术的基础上,以基于卷积神经网络的目标检测方法为基本研究框架,针对目标尺度变化,严重遮挡以及定位不准确等问题进行了深入研究,创新点及主要结论如下:
1. 针对行人检测任务,提出一种Scale-Aware Fast R-CNN模型,有效提高了检测方法对于目标尺度变化的鲁棒性。
2. 提取待检图像中的全局和局部上下文信息优化目标检测方法,可以提高目标分类和定位精度。
3. 建立了基于生成对抗网络的小目标检测模型,用于提高小目标的检测精度。
4. 建立了基于FPGA的实时电子稳像系统,为电子稳像算法的硬件移植及实时实现问题提供了有效的解决方案。
学术成果
读博期间,以第一编辑身份,发表包括会议在内的学术论文6篇,包括SCI刊源4篇(均为第一层次,最高影响因子IF="3.9),国际顶级会议2篇。参与合作SCI刊源或国际顶级会议论文3篇。获ImageNet大规模视觉识别挑战赛" (ILSVRC 2017),目标定位任务团队冠军,目标检测任务团队亚军,视频目标检测任务团队亚军(获奖排名分别为4,1,3)。
学术成果目录
1. Li J, Liang X, Shen S M, et al. Scale-aware fast R-CNN for pedestrian detection[J]. IEEE Transactions on Multimedia, 2018, 20(4): 985-996.
2. Li J, Wei Y, Liang X, et al. Attentive contexts for object detection[J]. IEEE Transactions on Multimedia, 2017, 19(5): 944-954.
3. Li J, Liang X, Li J, et al. Multistage Object Detection With Group Recursive Learning[J]. IEEE Transactions on Multimedia, 2018, 20(7): 1645-1655.
4. Li J, Liang X, Wei Y, et al. Perceptual generative adversarial networks for small object detection[100]//IEEE CVPR. 2017.
5. Li J, Wei Y, Liang X, et al. Deep attribute-preserving metric learning for natural language object retrieval[100]//Proceedings of the 2017 ACM on Multimedia Conference. ACM, 2017: 181-189.
6. Li J, Xu T, Zhang K. Real-time feature-based video stabilization on FPGA[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2017, 27(4): 907-919.
个人概况
李佳男,男,1991年3月生于吉林省长春市。2013年6月在DB官网大学光电信息工程专业获学士学位。2013年9月至今在DB官网大学光电学院攻读博士学位,期间以联合培养博士身份国家公派至新加坡国立大学(National University of Singapore)进行为期两年的学术交流访问。主要研究方向为深度学习框架下的目标检测方法,实时图像与视频处理等。
获奖感言
仰望星空,脚踏实地。