对话京东供应链首席科学家申作军「我是为“数
2019年11月20日,京东零售集团智能供应链Y业务管理部供应链开放日,美国加州大学伯克利分校工业工程系主任,京东供应链首席科学家,申作军教授做了题为《大数据驱动的自动补货系统研究》的公开演讲。科技新媒体《亲爱的数据》主编,谭婧,就机器学习技术如何在京东供应链场景里的应用,现场请教了申教授几个问题。
《亲爱的数据》:演讲中您提到,机器学习技术在做端到端的预测时,把供应链管理中的几个步骤忽略掉了,比如销量预测,补货预测。这样做会不会更粗糙了?应该怎样理解?
申作军教授:这个问题问得非常好,其实不是忽略掉了。供应链上存在信息歪曲的情况,这个就跟日常生活中传话一样,比如A跟B说一句话,B跟C传话,C再跟D传话,这个过程中信息会发生扭曲,而机器学习技术不会,机器替人类把数据的特征提取出来。
以前智能供应链系统是「分步走」式的决策流程,现在京东使用的是「端到端」补货决策模型,关键是避免了预测误差在决策中的放大。端到端补货决策模型的实质是,销量预测+VLT预测+补货决策用一个模型做出来,最后做到了自动下单。
《亲爱的数据》:基于机器学习技术的端到端补货决策模型,看上去省略了“分步走”式的决策流程,做到了“端到端”,但是,供应链上每一层的数据依然很重要吧?
申作军教授:你说得很对,每层的数据都得采集,而不是忽略数据。在人为估计的情况下,最开始估计的时候有可能就估计错了,后面就越错越多。需要强调的是,我们的端到端是一步解决了预测和决策两步,并不是跨越多层供应链的端到端。
不是说忽略中间数据,这些数据我们都采集,而且京东有能力采集到这些数据。比如库存管理,估计今年双十一能卖多少,数据会符合一个分布。但是,有可能一开始估计的时候就错了,供应链各个阶段就会越错越离谱。最终,双十一库存管理环节的成本就会变高。
《亲爱的数据》:京东之前是“分步走”,现在是“端到端”,供应链过程里的“经验”,是让机器自己去学习、自己去提取特征?
申作军教授:对。你理解得非常快。
《亲爱的数据》:您认为机器学习技术如何赋能京东供应链管理?
申作军教授:这个问题非常好,也非常大。
机器学习在其他领域的应用进展很快,AI是一定要打进供应链的。机器学习对于复杂系统是一个非常好的工具,供应链就是一个复杂系统。今天,京东的管理,对机器学习技术的应用是刚需。拿京东自营的产品来说,商品数量已达540万,如果我们不用机器学习和人工智能的方法,仅仅凭采销人员的经验和Excel表格,管理的精度和效率永远做不上去。
下一步我们想做的工作有很多,其中一个是做一个傻瓜式的库存系统,京东可以帮助小店智能补货。比如你去街边的小店买东西,一进店就会问“老板,啥啥啥有没有?”店主可能直接回答你“没有”。因为这种店商品品类少,可能就只有300个SKU,库存管理做得还很差。你应该听到过,现在智能家居场景会提到的,一台智能冰箱可以自动帮一个三口之家智能补货,提醒主人该去买鸡蛋了。京东的技术帮助小店融进供应链系统里来,赋能他们,帮助他们做好生意。
《亲爱的数据》:这个库存管理工具是toB(企业级服务市场)的思维吗?
申作军教授:都有。对企业级(toB)、对消费端客户(to C),京东都可以做,只要有数据,京东的机器学习技术可以帮你智能化。
《亲爱的数据》:您刚才谈到的是线下实体商铺的例子,在线上如果将机器学习技术的产品应用于京东平台的所有商铺,有数万家,他们的管理能力上去了,相当于京东平台的管理能力极大的增长了。
申作军教授:对。亚马逊公司有一块业务叫FBA(Fulfillment By Amazon),就是利用先进的管理技术和手段,帮助小店提高管理水平。今天的京东一定要做赋能,在京东平台上,预测、配送、库存,都可以做智能化的管理,比如补货的工具,就可以用到我刚才提到的端到端的自动补货系统。
《亲爱的数据》:京东正在做,还是打算要做?
申作军教授:京东现在已经在做增强平台能力,但是目前仅停留在和大的品牌厂商合作的层次上,并不是厚此薄彼,而是因为现阶段人力和资源有限,这也是我们急需AI算法的另一个原因。
《亲爱的数据》:傻瓜型,也就是通用型的,工具给所有的商铺使用,要大家都满意的结果。
申作军教授:对,这就是我们AI算法想要达到的目标。
《亲爱的数据》:研发周期会有多长?
申作军教授:只要我们这个团队一直做,应该很快。一到两年内应该能研发出比较好效果。这也是个持续优化的过程。自研技术工具帮助商铺进行数据分析、产生判断。工具给出的决策和结论,店主可以参考,或者自己去调整。慢慢成熟了之后,精度会越来越高。
《亲爱的数据》:京东的零售供应链数据是全中国最全面的,其他友商在这块不具备。这个现象不能武断地定论谁好,谁坏,各家各有特色。按道理,京东在这么好的数据基础之上,再利用机器学习这个工具,能创造出更高的价值,京东就有了独特的竞争优势。可以这样理解吗?
申作军教授:你说得非常对,京东有零售供应链最全面的数据。很多友商没有全面的数据,也没有一体化的决策系统。如果只是一个平台,供应链的很多环节没法做到整体优化。但是,京东不一样,京东可以全链条的优化,为什么我要在京东推“端到端”,因为我推得动,所有数据都有,都可以打通,其他友商就比较困难。
《亲爱的数据》:能不能说您加入京东是为了「数据」?
申作军教授:是。我想做更有意义的事情,其它电商的局限性使我没法做供应链深度的优化。
《亲爱的数据》:掌握了全链数据之后,京东供应链还有哪些地方值得去做优化呢?
申作军教授:我也思考供应链优化的重点在哪里。在京东这个生态平台上,可以优化的空间非常大,物流、运输、库存等方面,信息的共享可以产生很多降低成本的地方。举个例子,我俩都卖同样的东西,我俩地理距离又很近,你有100件库存,这时候,我正好缺货。我付钱,买你的库存。但是如果信息不连通,我不知道缺的库存正好在你那里,还要再次从遥远的地方进货,时间成本,物流成本都增加。这只是一个很简单的例子,如果能设计好数据和库存共享机制,优化好,就可以从双赢到多赢。
《亲爱的数据》:听您的讲解,我理解供应链的链状结构,在向网状结构发展。我理解的对吗?
申作军教授:没错,供应链不应该叫供应链,该叫供应网络。最早学术界研究供应链的时候,从研究库存开始,那时候是点到点的关系,所以叫做“链”。现在的供应链其实都是一个网络的,但是如果没有足够的数据分享,这种网络结构的供应链的优势很难体现出来。
《亲爱的数据》:能不能说,今天当京东这种角色出现了,网络里的信息才能够更好的传递,这样效率才能高。可以这样理解吗?
申作军教授:对,有了信任,才可以更好的做这件事情。
《亲爱的数据》:当拥有了开放数据平台,京东就是一家大数据公司。之前有很多数据和信息是看不到的,拿到了数据,就能提高效率,可以这样理解吗?
申作军教授:对的,一旦建成了大平台,数据共享之后,降本增效的机会就出现了。但是,能否拿到数据?这是一个挑战。
《亲爱的数据》:作为技术驱动型的公司,和美国电商亚马逊比较,京东的技术优势如何?
申作军教授:2017年,京东喊出,未来12年,京东只有三样东西——技术、技术、技术,坚信所有业务必须建立在技术之上。京东推行ABC与XY(A就是AI,人工智能,B是bigdata大数据,C是cloud云计算),并且在美国硅谷建有一个200多人的办公室。我的同事都是特别优秀的人才,来自MIT、Stanford、UCBerkeley、Georgia Tech、Michigan等美国知名高校。他们愿意在京东这个平台上做一些非常前沿的事情。
竞争是难免的,我们内部也经常和亚马逊做对比。我今天讲的《大数据驱动的自动补货系统研究》只是硅谷办公室参与生产的众多成果中的一个。另外,我们还做了很多数据驱动供应链管理方面的研究,不少结果也是业界领先的。
《亲爱的数据》:如何做到比亚马逊预测还精确?
申作军教授:只要我们利用好京东生态圈的高质量高深度更全面的数据,我们完全可以做得更好。
《亲爱的数据》:能否再具体地介绍下?
申作军教授:目前还是商业秘密。
《亲爱的数据》:能不能理解为,京东是做电商业务起家的,多年积累了丰富的业务知识,数据质量又非常好,促进了算法效果的提升?
申作军教授:对。现在是弱人工智能时代,人工智能一定有人机协作,不能只靠机器学习技术,第一,很慢。第二,人的智慧为什么不用?比如京东有很多做产销的资深人士,拥有多年业务经验,知道什么时候需求会上,什么时候会下。所以,我们会把人的经验加进机器学习的模型里面去,业务知识好好的发挥作用,机器学习模型的效果会更加好。
《亲爱的数据》:能不能说京东在硅谷的研发团队是一个望远镜?
申作军教授:对,我对研发团队的定位是,不要追着业务跑,而要带领着业务跑,做深度的研究,体现研发的前瞻性。把学术界特别优秀的知识成果吸收进来,再跟我们京东的业务去结合。硅谷这个团队精英非常多,京东在硅谷是跟Facebook(脸书)、谷歌去抢人才的,有了人才才能做一些供应链前瞻性的研究。
《亲爱的数据》:有没有发表过顶会论文?
申作军教授:有。我们硅谷研发中心发了很多论文,很多发表在顶级期刊和会议,比如顶级学术会议KDD(知识发现与数据挖掘),就发了差不多十篇论文。
申作军教授,作为京东供应链首席科学家,在演讲中多次提到产研结合的亲身体会。人工智能技术的应用激励着人工智能学者向本质问题挑战,而这些本质问题恰恰不是一个纯学术实验室环境能遇到的,本质问题常常生于工业界。申作军教授说,“翻阅大量库存管理的文献,发现有用的并不多。反而在攻克困难的过程中,既发展了思路,又开拓了视野。”
历史上,任何一次新技术的爆发都带来了超乎想象的新商业和经济模式,而人工智能技术是一种“嵌入式”技术,谁拥有了场景,就占领了新技术应用的高地。因为人工智能技术要进入某一垂直领域,就急需相关领域的知识和数据。无论京东的零售、物流,还是金融里都不缺少知识和数据。产研结合成为京东技术进化史重要的篇章,中国科技巨头京东正在敞开胸怀,利用人工智能技术大幅提高生产效率,让实践成为检验AI 的唯一标准。
(完)
附录(论文):
AutoNRL: Hyperparameter Optimizationfor Massive Network Representation Learning
Ke Tu, Jianxin Ma, Peng Cui, Jian Pei,Wenwu Zhu
Efficient and Effective Express viaContextual Cooperative Reinforcement Learning
Yexin Li, Yu Zheng, Qiang Yang
Off-policy Learning for Multiple Loggers
Li He, Long Xia, Wei Zeng, Zhi-Ming Ma,Yihong Zhao, Dawei Yin
Tackle Balancing Constraint forIncremental Semi-Supervised Support Vector Learning
Shuyang Yu, Bin Gu, Kunpeng Ning,Haiyan Chen, Jian Pei, Heng Huang
Unifying Inter-region Autocorrelationand Intra-region Structures for Spatial Embedding via Collective AdversarialLearning
Yunchao Zhang, Pengyang Wang, XiaolinLi, Yu Zheng, Yanjie Fu
Urban Traffic Prediction fromSpatio-Temporal Data using Deep Meta Learning
Zheyi Pan, Yuxuan Liang, Weifeng Wang,Yong Yu, Yu Zheng, Junbo Zhang
Conditional Random Field Enhanced GraphConvolutional Neural Networks
Hongchang Gao, Jian Pei, Heng Huang
ProGAN: Network Embedding via ProximityGenerative Adversarial Network
Hongchang Gao, Jian Pei, Heng Huang
Multi-Horizon Time Series Forecastingwith Temporal Attention Learning
Chenyou Fan, Yuze Zhang, Yi Pan,Xiaoyue Li, Chi Zhang, Rong Yuan, Di Wu, Wensheng Wang, Jian Pei and Heng Huang
Deep Uncertainty Quantification: AMachine Learning Approach for Weather Forecasting
Bin Wang, Jie Lu, Zheng Yan, HuaishaoLuo, Tianrui Li, Yu Zheng and Guangquan Zhang
TrajGuard: A Comprehensive TrajectoryCopyright Protection Scheme
Zheyi Pan, Jie Bao, Weinan Zhang, YongYu and Yu Zheng
UrbanFM: Inferring Fine-Grained UrbanFlows
Yuxuan Liang, Kun Ouyang, Lin Jing,Sijie Ruan, Ye Liu, Junbo Zhang, David Rosenblum and Yu Zheng
牛鞭效应(bullwhip effect),来自客户端的歪曲信息或者缺失信息,也就是说不准确的需求数据或者预测,会沿着供应链往上游逐级传递,并在供应链的各个阶段放大波动的程度。当供应链的成员在做订货决策时候,仅仅只考虑自己的利益,或者不能从相邻成员获取准确的需求信息的时候,牛鞭效应就会产生。企业就必须备下额外的库存来应对不确定性。