职位描述
1. 商品同款聚类算法研发:负责商品同款簇的聚类算法设计与优化,包括图像、文本、属性等多模态特征的融合与判别,提升同款识别的准确率和召回率。
2. 多模态特征算法:负责商品图像、标题、属性等多模态特征的提取、融合与优化,构建商品的多模态表征体系,支撑同款召回与判别。
3. 同款链路落地:负责同款算法在跨境、严选、即时零售、工业品等多场景的落地,设计场景化定制策略,达成各场景的同款指标要求。
4. 数据质量与监控体系:负责同款链路的数据质量巡检、监控告警、簇质量治理等基础设施建设,保障同款链路的稳定性和可观测性。
5. 大规模数据处理负责海量商品数据的加工、分析,通过 SQL 完成复杂的数据处理和指标计算,支撑算法迭代和效果评估。
职位要求
1、计算机科学、人工智能、数据科学等相关专业;
2、1 年以上商品算法或搜索推荐算法相关工作经验;
3、熟练掌握 Python, SQL,能够独立完成复杂数据查询、加工和分析,有大规模数据处理经验(10亿级数据量以上优先),熟悉 Linux 开发环境;
4、多模态算法:
熟悉计算机视觉(CV)和自然语言处理(NLP)基础算法
有图像分类、目标检测、图像检索、文本分类等实际项目经验
熟悉主流大语言模型(LLM)的原理和应用,有Prompt enginering、RAG、Agent方向实践经验。
熟悉主流多模态大模型(VLM)等多模态预训练模型的原理和应用,有图文匹配、VQA、视觉内容理解等实践经验。
5、要求具备商品理解、向量检索与召回、聚类算法一个或多个领域的项目经验积累,具备扎实的编程与工程能力。