职位描述
研究探索AIGC、LLM等大模型应用解决方案,负责AI业务核心技术攻坚,支持大模型应用的规模化,满足业务不断增长的智能交互需求。
主要工作方向包括不限于:
1、负责模型代码工程化,负责线上推理流程性能的分析和优化;
2、负责算法基础算子优化(图优化), 能够分析网络性能瓶颈并针对性的使用cuda对底层代码进行算子编写, 算子融合等优化手段;
3、负责模型压缩优化,使用量化、减枝等方案,减小模型存储并加速模型推理;
4、负责模型自动化分析、优化工具等基建的建设。
职位要求
1、拥有较强沟通、协作能力、学习能力,紧跟社区新技术进展,对新技术拥有热情;
2、熟悉至少一种主流的机器学习框架(TensorFlow / PyTorch),掌握业界主流Diffusion类算法的原理和优化方法,可以使用ControlNet、LoRA、超分等算法以实现可控编辑、修复美化等功能应用;
3、熟练掌握C/C++和Python语言,编码习惯良好;
4、熟悉至少一种机器学习网络部署框架(TensorRT, OnnxRuntime, TorchSrcipt)
5、熟悉计算机原理,有良好的数据结构基础,基础算法能力优秀,有ACM/ICPC、NOI/IOI等比赛获奖者优先;
6、拥有模型服务部署经验,熟悉模型性能分析和优化的方法,有模型优化经验。