关于
基本信息
- 姓名:李新元
- 出生:2003 年 10 月
- 身份:博士生
联系方式
研究兴趣
- 智能体系统
- 计算机使用代理
技能
- Python / C / C++
- 深度学习
- 大语言模型
🎓 教育背景
博士 - 人工智能专业 | 2025 - 至今 中国人民大学
本科 - 人工智能专业 | 2021 - 2025 中国人民大学
🔬 研究经历
AgentProcessBench | 2026.02-2026.03 RUCBM
围绕工具使用智能体(tool-using agents)的过程级评测展开研究。该工作关注长程、多轮工具调用轨迹中每一步是否有效,并通过逐步标注与统一评测协议分析模型在错误定位、有效探索和错误传播上的能力,为过程奖励模型(Process Reward Model, PRM)和可靠智能体评测提供更细粒度的基准。
AgentCPM-GUI | 2024.10-2025.02 OpenBMB
围绕移动端图形用户界面智能体(GUI agent)展开研究,目标是让模型根据自然语言指令在手机应用中完成真实操作。该工作结合界面定位预训练、监督微调和强化微调,提升模型对移动界面的感知、规划与动作执行能力,并重点覆盖中文移动应用生态中的复杂交互场景。
ProactiveAgent | 2023.10 - 2024.06 THUNLP
围绕主动式智能体(proactive agent)展开研究,探索 LLM agent 如何从等待用户指令的被动响应模式,转向能够根据上下文预判需求并主动提供帮助的交互模式。该工作通过真实用户活动构造主动任务预测数据,并引入人类偏好标注和奖励模型来评估智能体主动辅助的合理性。
📝 发表论文
preprint
AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents
EMNLP 2025
AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning
ICLR 2024
Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance
NeurIPS 2023
Enhancing In-Context Learning Performance with Just SVD-Based Weight Pruning: A Theoretical Perspective