职位描述
团队介绍
我们正在为商家构建 AI 时代的电商运营软件,重新定义商家的经营效率和商业价值。
阿里巴巴生态服务千万级商家,每天产生 EB 级交易、流量、行为、内容数据。我们的使命是让每一位商家——无论大小——都能用上「AI 时代的店铺经营数字人」。
这是一个 数据 + AI + 业务三位一体的岗位:你既能touch到top规模的数据基建,又能参与定义 AI 重塑电商运营。
岗位职责
一、商家主数据资产建设
1. 商家主数据资产建设:主导主数据域的建模与治理,沉淀高质量、可信主数据资产,为上层经营 Agent 提供唯一权威的数据来源;
2. 面向 Agent 消费的语义化建设:在传统数仓之上叠加指标语义层 / 业务语义层——把指标口径、维度组合、业务术语沉淀为 Agent 可直接理解和调用的 Metric / Dimension / Schema / Tool API,降低 LLM 幻觉、提升问数 / 经营诊断准确率;
3. 建设数据资产管理体系:元数据、血缘、质量、SLA、成本治理,保障数据底座的可信与可复用;
4. 基于 MaxCompute / Flink / Spark / Hologres / Hadoop 落地 EB 级数据流水线(实时 + 离线),保障数据供给的规模与质量;
二、AI Agent 数据飞轮&评测体系建设
5. 构建 Agent 轨迹数据治理:会话日志解析、Tool-Call 链路重构、Badcase 回流;
6. 主导 Agent / 产品 离线 + 在线双轨评测体系:Benchmark、自动评测脚本、Judge Model、人工抽检流程;
7. 建设 效果归因与指标体系,让产品好坏可量化、可追因;推动「线上 Badcase 评测集补充 数据修复 产品迭代」完整闭环。
8. 主导 数据合成(Data Synthesis):基于商家真实场景,生成 SFT / Preference / Tool-Call / NL2SQL 等高质量数据;
职位要求
【必备项】
1. 学历经验:本科及以上,3 年以上数据研发 / AI 数据工程 / 数据平台相关工作经验;
2. 数据工程:精通 SQL,熟练掌握 Java / Python / Sql 至少一种;具备扎实的数仓建模(维度建模/范式建模)与ETL 实战经验;
3. 大数据栈:熟悉 Hadoop / Hive / Spark / Flink / MaxCompute / Hologres 至少一套,独立主导过 TB ~ PB 级数据项目;
4. 数据治理:有元数据、血缘、质量、成本治理体系建设经验;
5. AI 数据 / 评测基础:理解 LLM / RAG / Agent 基本原理,了解 SFT/DPO 等训练范式;有 Agent 数据 / 数据合成 / 评测体系 实战经验;
6. 业务素养:能从业务问题出发倒推数据 & AI 方案,能与产品/业务高效协同推动落地。
【加分项】
有 电商、商家服务 业务背景
有 NL2SQL / 问数 / 数据 Agent / RAG 项目落地经验
有 Agent 评测体系(MT-Bench / AgentBench / 自建评测集) 建设经验