关于

个人照片

基本信息

  • 姓名:李新元
  • 出生:2003 年 10 月
  • 身份:博士生

联系方式

研究兴趣

  • 智能体系统
  • 计算机使用代理

技能

  • Python / C / C++
  • 深度学习
  • 大语言模型
中文 | English | 非正式版

🎓 教育背景

博士 - 人工智能专业 | 2025 - 至今 中国人民大学

本科 - 人工智能专业 | 2021 - 2025 中国人民大学

🔬 研究经历

AgentProcessBench | 2026.02-2026.03 RUCBM

围绕工具使用智能体(tool-using agents)的过程级评测展开研究。该工作关注长程、多轮工具调用轨迹中每一步是否有效,并通过逐步标注与统一评测协议分析模型在错误定位、有效探索和错误传播上的能力,为过程奖励模型(Process Reward Model, PRM)和可靠智能体评测提供更细粒度的基准。

AgentCPM-GUI | 2024.10-2025.02 OpenBMB

围绕移动端图形用户界面智能体(GUI agent)展开研究,目标是让模型根据自然语言指令在手机应用中完成真实操作。该工作结合界面定位预训练、监督微调和强化微调,提升模型对移动界面的感知、规划与动作执行能力,并重点覆盖中文移动应用生态中的复杂交互场景。

ProactiveAgent | 2023.10 - 2024.06 THUNLP

围绕主动式智能体(proactive agent)展开研究,探索 LLM agent 如何从等待用户指令的被动响应模式,转向能够根据上下文预判需求并主动提供帮助的交互模式。该工作通过真实用户活动构造主动任务预测数据,并引入人类偏好标注和奖励模型来评估智能体主动辅助的合理性。

📝 发表论文

preprint AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents
EMNLP 2025 AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning
ICLR 2024 Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance
NeurIPS 2023 Enhancing In-Context Learning Performance with Just SVD-Based Weight Pruning: A Theoretical Perspective