职位描述
我们是淘天集团-拍立淘多模态搜索算法团队,致力于构建智能化的多模态搜索新范式,让每一次搜索都能瞬间读懂用户需求,精准触达心仪商品,让购物体验更加简单、直观且充满惊喜;
依托在人工智能多模态大语言模型领域的深耕,近年团队已在 ICCV, CVPR, ECCV, AAAI, ICML, ICDE 等顶级国际会议上发表多篇论文。研究方向包含 LVLM 幻觉削减,多模态检索,图像描述,多模态可解释,LVLM 语义分割,无监督强化学习等多个前沿领域;
欢迎加入我们,一起探索 人工智能 技术,以重塑‘所见即所得’的搜索未来。团队长期招 LVLM Image Caption、 多模态生成式检索、多模态表征学习、Agentic Search System、图像生成 & LVLM post training 方向;
职位描述
1. 多模态理解/召回方向:负责多模态搜索全链路的多模态大模型化改造,包括query/商品理解、多模态大模型生成式检索召回、多模态大模型导购模型和多模态相关性大模型等;
2. 全模态Agentic System:负责全模态搜索新功能的算法实现、系统设计等,通过Agentic System更好了解用户意图,并提供最优搜索体验;
职位要求
1、计算机视觉和深度学习等相关专业,硕士/博士;
2、具备扎实的计算机视觉/机器学习/深度学习理论功底和算法经验,或者在该领域有优秀的学术成果 (例如,主流会议CVPR/ICCV/ECCV/NeurIPS/ICLR/ICML等,发表过一作论文);
3、在计算机视觉领域有高影响力成果者优先, 例如,高引论文,或者行业影响力比赛 (第1名), 或者优秀开源贡献者;
4、有利用视觉/深度学习创新技术解决行业难题,并带来大幅业务增长者优先;
5、熟练使用C/C++、Python其中一种开发语言;
6、有很强的创新能力,能够解决高挑战性问题,自我驱动能力强,并且有独立完成任务的能力;同时,具有良好的沟通技能和抗压能力。