业务技术-【急聘】大语言模型(LLM)算法工程师-AI软件研发方向

Alibaba -
杭州市

立即申请

职位详情

完整职位描述

基础信息

所属部门:

淘天集团

学历:

硕士

工作年限:

1 年

职位描述

背景介绍：我们正在构建一个深度理解淘宝研发上下文的领域大模型，目标是打造一个具备“架构师级”洞察力的AI模型，从根本上提升研发效率与质量。如果你渴望在一个真实、复杂的场景中，将LLM的能力推向新的高度，并亲手塑造下一代软件研发的未来，我们期待你的加入！ 1. 领域模型训练：负责淘宝研发领域大模型的核心算法，主导持续预训练（Continual Pre-training）、指令微调（SFT）和对齐（RLHF/DPO）等训练流程； 2. 知识注入与推理：设计并实践创新的数据方案，将代码、文档、配置等异构研发知识高效注入模型；通过多任务学习、FIM等范式，增强模型对软件工程的深度理解与复杂推理能力； 3. 能力评估与迭代：建立科学的评测体系，精准评估模型在代码溯源、影响分析、故障排查等高阶任务上的能力；分析bad case，驱动数据和算法的闭环优化。

职位要求

1. 专业背景：计算机、人工智能、软件工程等相关专业硕士及以上学历，3年以上经验；精通Python及至少一种深度学习框架（如PyTorch）。 2. 模型经验：具备扎实的NLP基础和LLM（如GPT/Llama）项目经验，熟悉预训练、SFT、RLHF等关键技术，有实际的大模型训练和优化经验。 3. 软件工程思维（重要加分项）：理解软件研发全流程，熟悉代码分析、系统架构等；有将AI技术应用于软件工程（AI for SE）领域，或具备知识图谱、知识工程背景者优先。 4. 综合素质：具备出色的问题拆解和解决能力，强自驱力与团队协作精神，对用AI解决复杂研发问题充满热情。

立即申请

求职者工具

雇主工具

浏览

保持联系