技术方向: 强化学习/时序大模型/世界模型/算法研发
工作内容
- 参与模型的预训练工作,通过系统性实验探索Flow Matching, Diffusion等先进方法与结构对模型序列预测能力的提升效果,完善其作为时序数据世界模型的能力。
- 协助时序模型的强化学习后训练相关的代码开发以及实验工作
职位要求
- 计算机/自动化/人工智能以及相关专业的在读硕士或博士
- 熟悉深度学习以及强化学习的基本理论以及大模型以及VLA相关的前沿理论 对大模型 Transformer 架构、扩散模型(Diffusion)、流匹配(Flow Matching)等相关研究有深入理解。
- 熟悉Pytorch 等常见机器学习框架,Ray/DeepSpeed等分布式训练框架,Python/C++等编程语言。能熟练使用 Git、Docker 等工具在 Linux 开发环境下工作。
- 能够灵活运用AI编程工具完成日常开发工作
- 能连续实习三个月以上,每周不少于三天的工作量
- 优先项: 在顶会以第一作者发表过论文者优先;开源项目(Star > 100)的核心开发者优先。