业务技术-AI Agent 优化工程师-资金结算方向

Alibaba -
杭州市

立即申请

职位详情

完整职位描述

基础信息

所属部门:

淘天集团

学历:

本科

工作年限:

1 年

职位描述

围绕资金结算核心场景，参与AI应用的系统化构建，聚焦AI应用的评测和持续优化，具体职责包括以下一项或多项： 1. 资金结算 Agent 系统设计与落地面向货款结算、佣金清分、退款回流、对账核销、商家提现、跨境结算等场景，设计并实现生产级AI Agent系统持续优化Agent能力，创造可量化的业务价值（对账自动化率、结算异常处理时效、商家咨询自助解决率等） 2. AI应用全生命周期演进深度参与结算业务问题建模、Prompt工程、训练数据构建、自动化评估体系搭建与模型后训练优化探索SFT、RLHF、Agent RL等技术在资金结算场景中的最佳实践平衡模型效果、推理成本与资金安全的工程质量要求 3. 评测体系构建面向资金结算业务目标（准确率、合规性、时效性），设计完备的Agent效果评估体系构建自动化评估框架（LLM-as-a-Judge），建立离线评估与在线业务指标（结算准确率、异常拦截率、自助解决率等）的量化联动能力通过AB测试、人工评测、badcase分析形成持续迭代闭环 4. 强化学习与奖励机制设计构建面向资金结算场景的可工程化Reward体系与RL训练环境重点提升模型在资金合规性判断、多步结算流程决策、异常资金归因推理等垂直场景中的可控性与泛化能力 5. 生产级系统交付构建高并发、低延迟、高可用的Agent推理服务，满足资金场景的金融级可靠性要求实现可观测性体系（监控、日志、链路追踪、资金安全审计），保障线上稳定性通过量化、剪枝、Cache优化等手段提升系统性能，控制推理成本

职位要求

基础要求 1.学历背景：本科以上，计算机、人工智能、数学、统计学、软件工程等相关专业优先 2.模型理解与优化：深入理解Transformer和主流LLM模型架构演进原理，对后训练算法（SFT/RLHF/DPO等）有实操经验和深刻认知，拥有Agentic RL训练实操经验者优先 3.AI应用构建能力：掌握主流AI协议（MCP、Skills等）、记忆系统（Memory）、知识库（RAG）；理解Agent核心技术（ReAct、CoT、Tool Use、Memory Management、Multi-Agent） 3.Agent落地经验：必须具备线上大规模Agent系统实际落地经验，具备Agent系统架构设计、技术选型、评测和持续优化的能力和实践经验 4.代码与工程能力：熟练掌握PyTorch，了解大模型训练与推理框架（Megatron-LM、vLLM、DeepSpeed等）；熟练Java/Python任一 5.数据构建能力：有很强的Data-centric AI意识，精通后训练所需高质量数据挖掘与构造，具备合成数据（Synthetic Data）与动作轨迹（Trajectory）构建实操经验者优先 6.评测能力：拒绝盲目调参，能针对Agent任务设计科学的评测体系（LLM-as-a-Judge），能基于评测结果精准分析和定位问题，具备复杂多步任务的量化评估能力者优先加分项 1.顶会论文：在AI顶会（ACL/EMNLP/ICLR/NeurIPS/ICML等）发表大模型评测、数据合成、Agent、RL相关一作或共一论文 2.开源贡献：知名大模型评测框架或高质量开源数据核心贡献者 3.数学与逻辑：极强的数学功底和逻辑分析能力，对高质量数据和评测有端到端闭环经验 4.资金/金融场景经验：有资金结算、支付清算、金融风控、对账核销等场景的AI落地经验理解资金结算核心指标（结算时效、对账准确率、异常处理效率、资金安全合规等）有金融级系统（高可用、强一致性、可审计）的开发经验

立即申请

求职者工具

雇主工具

浏览

保持联系