关于

基本信息

姓名：李新元
出生：2003 年 10 月
身份：博士生

联系方式

研究兴趣

智能体系统
计算机使用代理

技能

Python / C / C++
深度学习
大语言模型

中文 | English | 非正式版

🎓 教育背景

博士 - 人工智能专业 | 2025 - 至今 中国人民大学

本科 - 人工智能专业 | 2021 - 2025 中国人民大学

🔬 研究经历

AgentProcessBench | 2026.02-2026.03 RUCBM

围绕工具使用智能体（tool-using agents）的过程级评测展开研究。该工作关注长程、多轮工具调用轨迹中每一步是否有效，并通过逐步标注与统一评测协议分析模型在错误定位、有效探索和错误传播上的能力，为过程奖励模型（Process Reward Model, PRM）和可靠智能体评测提供更细粒度的基准。

AgentCPM-GUI | 2024.10-2025.02 OpenBMB

围绕移动端图形用户界面智能体（GUI agent）展开研究，目标是让模型根据自然语言指令在手机应用中完成真实操作。该工作结合界面定位预训练、监督微调和强化微调，提升模型对移动界面的感知、规划与动作执行能力，并重点覆盖中文移动应用生态中的复杂交互场景。

ProactiveAgent | 2023.10 - 2024.06 THUNLP

围绕主动式智能体（proactive agent）展开研究，探索 LLM agent 如何从等待用户指令的被动响应模式，转向能够根据上下文预判需求并主动提供帮助的交互模式。该工作通过真实用户活动构造主动任务预测数据，并引入人类偏好标注和奖励模型来评估智能体主动辅助的合理性。

📝 发表论文

preprint AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents

EMNLP 2025 AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning

ICLR 2024 Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance

NeurIPS 2023 Enhancing In-Context Learning Performance with Just SVD-Based Weight Pruning: A Theoretical Perspective