职位描述
团队背景:淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。
工作职责
1. 和淘宝电商搜索业务紧密结合,设计和改进机器学习模型的架构,实现高效的搜索大型模型训练和推理系统(特别是大规模语言模型,GPT、LLaMA、通义千问等),确保其高效性和准确性,以提高计算性能和加速模型收敛
2. 负责百亿参数以上超大模型的推理训练与性能优化:进行搜索在线模型的性能分析和调优,识别和解决瓶颈问题,提高模型的训练和推理速度,以适应并充分利用硬件资源,确保在高效计算资源利用的前提下,提供快速响应的搜索业务体验
3. 应用不限于剪枝、量化、知识蒸馏,各种并行策略(DP/TP/PP/EP等)等技术来优化模型的复杂度和运行速度,同时探索模型在样本、训练、存储和推理的极致性能
4. 在大模型的Token压缩方面进行性能探索,包含入图前的超长token压缩甚至长token直接入图等性能优化,以满足大模型结合超长token在海量数据以及极致在线性能的应用
5. 和工程团队协同,依据训练推理机器资源水位以及优化空间,简化和加速模型训练和推理的部署过程,实现离线在线资源的高性价比利用。
6. 参与设计和优化淘宝整体搜索系统,包括多阶段漏斗设计和整体链路设计,确保系统的稳定性和高效性
职位要求
1. 计算机科学、人工智能、机器学习或相关领域的硕士及以上学历,在剪枝、量化等相关领域发表过优秀论文优先,包括但不限于NeurIPS、ICLR、ICML等会议或期刊
2. 熟悉常见的分布式机器学习框架,Megatron、DeepSpeed、HuggingFace,熟悉分布式计算和并行计算的概念和技术,有相关的实际经验
3. 有工业界相关方向的实践经验者,包含但是不限于算法工程经验,参加过ACM或数据挖掘/机器学习类竞赛并取得优异名次者优先
4. 深入理解机器学习算法和模型的原理和实践,熟悉常见的机器学习框架,如PyTorch、TensorFlow等,并具有丰富的实际项目经验
5. 有强烈求知欲,对人工智能领域相关技术有热情;学习能力强,对新事物保有好奇心
6. 具备良好的沟通和团队合作能力,能够与跨功能团队密切合作,解决问题并实现共同目标