116
在北京市, c22的英语个职位
More jobs to discover
Find similar jobs that you might be interested in.
Lenovo —北京市
承担端侧LLM/多模态模型优化与部署工作,集成OpenVINO、ONNX Runtime等推理框架,支持CPU/GPU/NPU异构加速;实施模型量化、KV-Cache管理、算子融合与图优化等方案,达成内存占用降低、长上下文支持及性能提升目标;支持结构化输出,搭建本地RAG管线并结合隐私保护与离线优先策略。.
我想收到关于 北京市, c22 的 英语 的最新职位提醒
一旦登录您的账户,即表明您同意 SimplyHired 的服务条款和我们的Cookie 协议及隐私政策。