关于

我是清华大学计算机系自然语言处理实验室副教授,主要研究方向为自然语言处理、知识图谱及社会计算。长期招收博士生(每年1个名额)、博士后和访问学生。请感兴趣的同学阅读相关说明,请申请者发送邮件联系我并附简历。

论文发表

完整论文列表详见我的谷歌学术资料


指导学生

研究生

  • 涂存超 (2013-2018): 与孙茂松教授共同指导, 博士生. 社会计算与网络表示. 获清华大学优秀博士毕业生、优秀博士论文、北京市优秀毕业生. 毕业留清华大学博士后,后联合创始幂律智能初创企业. 博士论文
  • 阿雅娜 (2013-2019): 与孙茂松教授共同指导, 博士生. 文档摘要. 毕业赴内蒙古财经大学任教. 博士论文
  • 林衍凯 (2014-2019): 与孙茂松教授共同指导, 博士生. 知识图谱表示、构建与应用. 获清华大学学术新秀、北京市优秀毕业生、百度学者. 毕业赴腾讯微信AI部门工作. 博士论文
  • (2014-2019): 博士生, 合作网络表示学习研究. 网络表示学习及其应用. 毕业赴北京邮电大学任教. 博士论文
  • 谢若冰 (2014-2017): 与孙茂松教授共同指导, 硕士生. 知识表示学习. 获西贝尔学者、清华大学优秀硕士生、优秀硕士论文、北京市优秀毕业生. 毕业去腾讯微信部门工作. 硕士论文
  • (2017-2023): 博士生. 毕业留清华任助理研究员.
  • 钟皓曦 (2018-2021): 硕士生.
  • (2018-2023): 博士生.
  • (2018-2021): 硕士生.
  • 张凯韬 (2018-2021): 硕士生.
  • 张正彦 (2019-2024): 博士生.
  • 崔淦渠 (2019-2024): 硕士生.
  • 肖朝军 (2020-在读): 博士生.
  • 曾哲妮 (2020-在读): 博士生.
  • 秦禹嘉 (2020-2024): 博士生.
  • (2020-2023): 硕士生.
  • 王凤玉 (2020-2023): 硕士生.
  • 胡声鼎 (2020-在读): 硕士生.
  • 陈暐泽 (2021-在读): 博士生.
  • (2021-在读): 博士生.
  • 王聿中 (2021-2024): 硕士生.
  • 贺超群 (2021-在读): 硕士生.

本科生

  • 2020级
    • 成 ( THU -> UIUC )
    • 田润初 ( THU -> UIUC )
    • 曾致远 ( THU -> UW PhD )
    • 司程磊 (THU -> Stanford PhD)
    • 刘鸿樟 (THU -> USYD)
  • 2018级
    • 肖光烜 ( THU -> ) MIT 清华一二·九奖学金、学生“未来学者”
    • ( THU -> )清华大学“科技创新 星火燎原”、学生“未来学者”
    • 杜雨峰 ( THU -> UIUC )
    • 陈扬意 ( HUST -> UIUC )
  • 2017级
    • 昊 (THU -> CMU PhD)
    • 刘致远 (THU -> NUS PhD)
    • 陈雨琳 (THU -> THU Master -> NYU PhD)
    • 袁立凡 (THU -> )
    • 詹棋闵 (THU -> HKUST PhD)
    • 于子淳 (THU -> CMU)
    • 范政贤 (THU -> Oxford PhD)
    • 维 (THU -> KCL)
    • 凯 (THU -> OSU)
    • 陈乾瑜 (HIT -> CUHK PhD)
    • 李振宇 (THU -> )
  • 2016级
    • 曾国洋 (THU -> THU -> Startups)
    • 亮 (BUPT->)
    • 傲 (NJU -> NUS PhD)
    • 高天宇 (THU->)
    • 胡声鼎 (THU->THU Master)
    • 黄俊杰 (BUAA->)
    • 计昊哲 (THU->THU PhD)
    • 欧阳思聪 (BUPT->)
    • 秦禹嘉 (THU->THU PhD)
    • 王晓智 (THU->THU PhD)
    • 吴睿东 (THU->)
    • 肖朝军 (THU->THU PhD)
    • 张觉晓 (THU->)
    • 峰 (THU -> UCSD PhD)
  • 2015级
    • 想 (THU->)
    • 顾逸宏 (THU->Hongkong)
    • 刘致远 (XJTU->NUS)
    • 龙上邦 (PKU->CMU Master)
    • 乔逸凡 (THU->)
    • 宋长河 (THU->THU Master)
    • 俊 (THU->USC PhD)
    • 杨承昊 (Beihang->)
    • 于鹏飞(THU->UIUC PhD)
    • 于志竟成 (THU->NUS PhD)
    • 张钰晖 (THU->)
    • 张正彦 (THU->THU PhD)
    • 昊 (THU->)
  • 2014级
    • 叶德铭 (THU->THU PhD)
    • 远 (THU->THU PhD)
    • 杜家驹 (THU->THU Master)
    • 牛艺霖 (THU->THU PhD)
    • 钟皓曦 (THU->THU Master)
    • 王子云 (THU->NYU Master)
    • 极 (THU->U Waterloo PhD)
    • 胡紫昆 (THU->NUS PhD)
    • 唐路明 (THU->Cornell PhD)
    • 袁星驰 (THU->Google)
  • 2013级
    • 磊 (THU->MIT PhD)
    • 旭 (THU->THU PhD)
    • 郭志芃 (THU->THU Master)
    • 曾文远 (THU->U Toronto PhD)
    • 吴佳炜(THU->UCSB PhD)
    • 豪 (THU->NTU PhD)
  • 2012级
    • 罗鸿胤 (THU->MIT PhD)
    • 林子钏 (THU->THU Master)
    • 张惟诚 (BUPT->JHU Master)
    • 尹德阳 (BUPT->Columbia Master).
  • 2011级
    • 扬 (THU->UIUC PhD)
    • 史天泽 (THU->Cornell PhD)
    • 颖 (BUPT->RPI PhD)
    • 宫海天 (BUPT->CMU Master).
  • 2010级
    • 焱 (THU->CMU Master)
    • 林衍凯 (THU->THU PhD)
  • 2009级
    • 晗 (THU->Waterloo Master)
    • 晨 (THU->PSU PhD)
    • 瀚 (THU->WISC PhD)
    • 涂存超 (THU->THU PhD)
    • 储孝文 (BUPT->CMU Master)
  • 2008级
    • 张思聪 (THU->Georgetown PhD)
    • 何伟鹏 (THU->Hamburg Master)
  • 2007级
    • 黄文溢 (THU->PSU PhD)
    • 陈新雄 (THU->THU PhD->创业)
  • 2006级
    • 李逍霄 (BUPT->Alberta Master)
    • 川 (THU EE->UMN PhD)
  • 2005级
    • 鹏 (THU->THU PhD->百度IDL)


个人简介

教育工作经历

  • 2017年12月 - 至今. 清华大学计算机系, 教研系列准聘副教授.
  • 2016年 8月 - 2017年12月. 清华大学计算机系, 教研系列助理教授.
  • 2013年12月 - 2016年 8月. 清华大学计算机系, 助理研究员.
  • 2011年 8月 - 2013年12月. 清华大学计算机系, 博士后.
  • 2006年 8月 - 2011年 7月. 清华大学计算机系, 博士.
  • 2002年 8月 - 2006年 7月. 清华大学计算机系, 本科.

研究项目

  • 项目负责人. 大规模知识图谱的分布式表示学习、知识获取与推理应用(61572273). 国家自然科学基金 (NSFC)面上基金项目, 2016-2019.
  • 项目负责人. Robust Full-document Entity Recognition and Disambiguation with Large-Scale Knowledge Bases. 清华大学媒体与网络技术教育部-微软重点实验室. 2014-2015.
  • 项目负责人. Efficient Chinese Entity Linking for Large-scale Web Corpus to Heterogeneous Entity * Networks. 清华大学媒体与网络技术教育部-微软重点实验室. 2013-2014.
  • 项目负责人. 基于协同语义计算的社交媒体信息扩散与可信性研究(61202140). 国家自然科学基金 (NSFC)青年基金项目, 2013-2015.
  • 项目参与人. 关键词抽取与社会标签推荐相结合的中文文本主题词自动标注方法研究. 国家自然科学基金 (NSFC)面上项目, 2012-2015.
  • 项目参与人. 汉语复杂网络的性质、结构、演化及其典型应用研究. 国家自然科学基金 (NSFC)面上项目, 2009-2011.
  • 项目参与人. 大规模网络图文数据的语义分类和适度理解技术研究. 863项目, 2007-2009.

获得奖励

  • 2021. Frontiers of Computer Science期刊2019-2020年度优秀青年AE.
  • 2021. 清华大学优秀硕士学位论文指导教师 (硕士毕业生:钟皓曦).
  • 2021. 清华大学教学成果一等奖 - 坚持思想引领与因材施教并举,构建“五星计划”三全育人体系 (刘奕群, 刘知远, 谢晓晖, 韩文弢, 韩旭).
  • 2021. 清华大学教学成果一等奖 - “德、能、严”引领驱动的计算机系博士生“三全”创新培养体系 (孙茂松, 武永卫, 刘知远, 易鑫, 鲍丽薇).
  • 2020. 教育部高等学校科学研究优秀成果奖(科学技术)自然科学奖一等奖 - 结构化知识表示学习方法(完成人:孙茂松, 刘知远, 林衍凯, 杨成, 谢若冰).
  • 2020. 中国中文信息学会科学技术奖/钱伟长中文信息处理科学技术奖 - 大规模中文词汇语义分析关键技术及其开源应用 (完成人: 孙茂松, 刘知远, 刘洋, 杨麟儿, 陈新雄, 涂存超, 李鹏, 司宪策, 乔维).
  • 2020. 国家青年拔尖人才计划.
  • 2020. 中国精品科技期刊顶尖学术论文(F5000, 论文题目: 知识表示学习研究进展, 学生作者: 林衍凯, 谢若冰).
  • 2020. 《中国科学: 信息科学》2019年热点论文奖(论文题目: 网络表示学习综述, 学生作者: 涂存超, 杨成).
  • 2020. 《清华大学学报(自然科学版)》优秀审稿人.
  • 2020. AI 2000人工智能全球最具影响力学者.
  • 2020. SIGIR 2020 最佳短文奖(第一作者:于是).
  • 2020. 清华大学先进工作者.
  • 2019. 中国计算机学会杰出演讲者.
  • 2019. 北京智源人工智能研究院青年科学家.
  • 2019. 中国新闻传播学年鉴优秀论文奖(论文题目: 社交媒体平台谣言的早期自动检测, 学生作者: 宋长河, 杨成).
  • 2018. MIT TR 35中国区榜单.
  • 2017. 中国科协青年人才托举计划.
  • 2016. 中国中文信息学会-钱伟长中文信息处理科学技术奖青年创新一等奖.
  • 2016. 清华大学教学成果二等奖 (第3完成人/共5位申请人).
  • 2015. CCF-Intel 青年学者提升计划 (全国6人/17位候选人).
  • 2014. 清华大学教学成果二等奖 (第3完成人/共5位申请人).
  • 2013. 清华大学优秀博士后.
  • 2012. 清华大学林枫辅导员奖.
  • 2012. 中国人工智能学会优秀博士学位论文奖.
  • 2012. 清华大学教学成果一等奖 (第3完成人/共5位申请人).
  • 2011. 清华大学优秀博士学位论文二等奖.
  • 2011. 清华大学百年校庆工作先进个人.
  • 2010. Google中国优秀实习生奖.
  • 2010. 清华大学一等奖学金 (搜狐奖学金).
  • 2009. 清华大学一等奖学金 (董氏东方奖学金).
  • 2008. 清华大学一二九辅导员奖.
  • 2008. 清华大学一等奖学金 (董氏东方奖学金).
  • 2006. 清华大学优良毕业生.

学术服务

  • 中国中文信息学会青年工作委员会主任, 计算语言学专委会委员, 语言与知识计算专委会委员, 社会媒体处理专委会秘书长