职位描述
1. 负责天猫技术在各域的Agent算法优化,包括ToB和ToP相关产品,如AI商品运营、百补AI导购、品牌商家AI访谈;
2. 主导大模型后训练与领域适配,参与Agent在各业务场景下的微调于多轮对话优化,提升模型在生意诊断、运营策略、导购方案生成、工具决策等任务中的专业性与一致性。
3. 运用SFT、RL等后训练方法,设计合理Reward Function和优化函数,提升大模型在自主规划(Planning)、多步推理、工具调用、数据问答等方面的能力;
4. 负责设计并优化检索增强(RAG)系统,从索引构建、召回排序到知识融合与上下文压缩,全面提升RAG在高准确性需求场景下的效果与稳定性。
5. 深入跟踪LLM/Agent领域前沿进展,推进前沿技术在业务中的验证与落地,重点突破工具集成复杂推理、数据洞察、AI 搜索等方向的应用创新;
6. 负责建立科学评测体系,设计覆盖功能性、合规性、一致性与业务转化的多维评估指标,系统分析模型表现,指导模型与Agent策略的精准优化。