职位描述
围绕资金结算核心场景,参与AI应用的系统化构建,聚焦AI应用的评测和持续优化,具体职责包括以下一项或多项:
1. 资金结算 Agent 系统设计与落地
面向货款结算、佣金清分、退款回流、对账核销、商家提现、跨境结算等场景,设计并实现生产级AI Agent系统
持续优化Agent能力,创造可量化的业务价值(对账自动化率、结算异常处理时效、商家咨询自助解决率等)
2. AI应用全生命周期演进
深度参与结算业务问题建模、Prompt工程、训练数据构建、自动化评估体系搭建与模型后训练优化
探索SFT、RLHF、Agent RL等技术在资金结算场景中的最佳实践
平衡模型效果、推理成本与资金安全的工程质量要求
3. 评测体系构建
面向资金结算业务目标(准确率、合规性、时效性),设计完备的Agent效果评估体系
构建自动化评估框架(LLM-as-a-Judge),建立离线评估与在线业务指标(结算准确率、异常拦截率、自助解决率等)的量化联动能力
通过AB测试、人工评测、badcase分析形成持续迭代闭环
4. 强化学习与奖励机制设计
构建面向资金结算场景的可工程化Reward体系与RL训练环境
重点提升模型在资金合规性判断、多步结算流程决策、异常资金归因推理等垂直场景中的可控性与泛化能力
5. 生产级系统交付
构建高并发、低延迟、高可用的Agent推理服务,满足资金场景的金融级可靠性要求
实现可观测性体系(监控、日志、链路追踪、资金安全审计),保障线上稳定性
通过量化、剪枝、Cache优化等手段提升系统性能,控制推理成本
职位要求
基础要求
1.学历背景:本科以上,计算机、人工智能、数学、统计学、软件工程等相关专业优先
2.模型理解与优化:深入理解Transformer和主流LLM模型架构演进原理,对后训练算法(SFT/RLHF/DPO等)有实操经验和深刻认知,拥有Agentic RL训练实操经验者优先
3.AI应用构建能力:掌握主流AI协议(MCP、Skills等)、记忆系统(Memory)、知识库(RAG);理解Agent核心技术(ReAct、CoT、Tool Use、Memory Management、Multi-Agent)
3.Agent落地经验:必须具备线上大规模Agent系统实际落地经验,具备Agent系统架构设计、技术选型、评测和持续优化的能力和实践经验
4.代码与工程能力:熟练掌握PyTorch,了解大模型训练与推理框架(Megatron-LM、vLLM、DeepSpeed等);熟练Java/Python任一
5.数据构建能力:有很强的Data-centric AI意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实操经验者优先
6.评测能力:拒绝盲目调参,能针对Agent任务设计科学的评测体系(LLM-as-a-Judge),能基于评测结果精准分析和定位问题,具备复杂多步任务的量化评估能力者优先
加分项
1.顶会论文:在AI顶会(ACL/EMNLP/ICLR/NeurIPS/ICML等)发表大模型评测、数据合成、Agent、RL相关一作或共一论文
2.开源贡献:知名大模型评测框架或高质量开源数据核心贡献者
3.数学与逻辑:极强的数学功底和逻辑分析能力,对高质量数据和评测有端到端闭环经验
4.资金/金融场景经验:
有资金结算、支付清算、金融风控、对账核销等场景的AI落地经验
理解资金结算核心指标(结算时效、对账准确率、异常处理效率、资金安全合规等)
有金融级系统(高可用、强一致性、可审计)的开发经验