电商供应链数仓平台该如何建设?哪些点需要注意?

热爱学习的你真棒!我是onedayday,每天和你一起学点大数据。

01

业务介绍

蜀海供应链成立于2011年6月,是集销售、研发、采购、生产、品保、仓储、运输、信息、金融为一体的餐饮供应链服务企业,现为广大餐饮连锁企业及零售客户提供整体食材供应链解决方案服务。

我们主要业务如下图:

我们的数仓分层:

大数据团队主要负责到ODS-DWS的建设,从DWS到ADS一般是数仓系统和业务线系统的边界。

在过去,由于缺失统一的数据仓库,业务系统之间又相互依赖,业务系统那边也探索了很多模式来支持各个业务线发展。但是效果都不是很好,出现各种各样的问题,随着业务的发展,数据量也越来越大,之前的模式也越越来越不堪负重。

02

架构演进

我来公司之前这边大数据团队规模也比较小,业务量也没那么大,当时只是为了支撑海底捞门店补货系统(几家门店试点),搭建了基于CDH一套大数据平台,主要是为了完成每十分钟给补货系统推送一批计算好的数据,主要是POS销售数据,沽清数据等,每天在全量的推送一次一整天的数据,当时的架构如下:

这是当时的大数据架构,为了解决这个问题,基本上能用的组件都用了,但是数据的实时性还是满足不了需求。

这个架构存在的问题:

①为什么选择Doris?

对我们用户来说,Doris的优点是功能强大,易用性好。功能强大指可以满足我们用户的需求,易用性好主要指兼容Mysql协议和语法,以及OnlineSchemaChange。兼容Mysql协议和语法让用户的学习成本和开发成本很低,OnlineSchemaChange也是一个很吸引人的feature,因为在业务快速发展和频繁迭代的情况下,Schema变更会是一个高频的操作。

对我们平台侧来说,Doris的优点是易运维,易扩展和高可用:

如下图:

下面这个图可能更清晰的看清楚我们基于Doris的数据流向

我们基于Doris开发了自己的数据中台,主要是为了解决以下五个问题:

围绕上面这五个问题,我们设计和开发了公司的数据中台,下面主要介绍基于Doris开发数据中台过程中我们做的一些工作。

我们这边业务库基本都是Mysql,也有非Mysql数据库,基于这种情况,我们采用了Canal及Datax完成数据采集,同时对Datax进行了改造,是Datax抽取的数据格式和Canal一致,然后通过Flink基于DorisStreamLoad完成数据入仓操作,整个过程可以零代码完成,并集成了我们自研的规则引擎,实现规则自定义及规则自动下发到FlinkJob中,具体展示效果如下:

数据分析人员可以通过Web方式零代码完成业务数据接入,最后提交任务即可。

目前支持Mysql,Kafka,Datax,这里我们采用的是Canal实现对Mysqlbinlog进行监控,然后将mysql的数据实时推送到Kafka,接入任务可以监控,接入数据量可监控

数据接入到Doris数据仓库对应的表中,这里我们采用的是Flink实时消费KafKa的数据,然后通过Doris的StreamLoad完成。Flink消费Kafka数据我们支持两种方式:

针对FlinkJob失败,可能会造成数据丢失的问题,我们解决方案如下:

因为我们这个是在数据接入层使用的,数据是进入到数据仓ODS层,在这一层我们采用的是DorisUniqueKey模型,就算数据重复入库,也会自动覆盖原先的数据(这是DorisUniqueKey模型的特点),不会出现数据重复的问题。

提供内置规则模板,及规则定义可视化开发界面,规则试跑,规则发布等,发布的规则会自动下发到FlinkJob对应的作业中执行。

2.基于Doris数仓的元数据管理

基于Doris我们实现了元数据管理(业务元数据及技术元数据),提供物理元模型及血缘元模型的构建,提供一键搜索的数据地图服务。

血缘关系:通过解析Doris审计日志,自动化完成

关联关系:这个主要是在ODS(贴源层),因为业务系统数据库表没有主外键关系,在这里我要知道数据之间关联关系,通过手动定义维护。

我们为了快速响应业务系统的数据服务需求,设计开发了接口零代码开发平台,数据分析人员不需要写代码就可以快速完成API接口的开发,可以对接口进行可视化上下线操作,接口调用限制(黑白名单),支持降级限流熔断等,快捷方便,高效。

在指标系统完成基于审批流程的指标规范化定义,严格定义指标规范,规避指标二义性;支持和其它产品联动影响和展示,产品如模型设计中心、数据地图等。

我们将海豚调度深度集成到我们的数据中台中,各个模块可以很方便的将任务添加到海豚调度系统中运行及监控。

为了让Doris更好的适应各种异构数据的融合分析,使用大规模分布式环境下的机器学习场景及实时数据分析的场景,我们设计并发了FlinkDorisConnector,同时贡献给了社区。具体的实现方案通过主数据分区来并行执行,大大提高了读取的速度和效率。同时通过FlinkSQL方式读写Drois数据。读数据主要进行异构数据源的关联分析,在回写到Doris数仓里面去。

详细的设计方案可以参考我的博客:「FlinkDorisConnector设计方案」

04

收益

目前10台BE,3台FE(高可用)的Doris环境,效率、性能表现情况如下:

THE END
1.供应链电商平台百科摘要: 供应链电商平台是利用互联网技术整合供应链资源,提供商品交易、物流、金融等服务的电子商务平台。它们通过优化供应链流程,提高效率,降低成本,为企业提供竞争力。 1. 供应链电商平台的运营模式 供应链电商平台的运营模式是用户最关心的话题之一。这种平台通过整合上下游资源,优化供应链流程,提高效率,降低成本,从而https://m.ihimall.cn/news/4359.html
2.什么叫跨境电商供应链模式多渠道销售:跨境电商供应链模式需要覆盖多个国家和地区的销售渠道,包括自建网站、第三方电商平台、社交媒体等多种形式。 复杂的物流环境:由于涉及到不同国家和地区的海关法规、税收政策等因素,跨境电商供应链模式的物流环节相较于传统贸易更为复杂。 信息流、物流、资金流的整合:为了提高效率和降低成本,跨境电商供应链https://www.51969.com/post/19529483.html
3.电商供应链平台是什么意思,电商供应链服务电商供应链平台是什么意思 电商供应链平台指的是专门为电子商务设计的一套集成化系统或平台,用于管理从商品采购、存储、运输到销售的全过程。这种平台旨在优化供应链的各个环节,提高效率,降低成本,同时确保商品能够快速、准确地送达消费者手中。 电商供应链平台通常包含以下几个核心模块: https://www.4pnt.com/news/tuolingyun/1797.html
4.构建高效电商平台的基石(电商运营框架是什么意思)在数字化浪潮的推动下,电商行业迅速崛起,成为经济发展的新引擎。而电商运营框架,则是构建高效电商平台的基石。本文将为您详细解析电商运营框架的含义及其重要性。 什么是电商运营框架? 电商运营框架,是指电商企业在开展业务过程中,对各项运营活动进行系统化、模块化管理的整体架构。它包括产品管理http://yunying.zaixianjisuan.com/baike/dian-shang-yun-ying-kuang-jia-jie-mi-gou-jian-gao-xiao-dian-shang-ping-tai-de-ji-shi.html
5.erp电商平台是什么意思零代码企业数字化知识站erp电商平台是什么意思 ERP电商平台是指将企业资源规划(ERP)系统与电商平台相结合的解决方案,用于优化和自动化企业的电子商务运营。这个组合能够帮助企业高效管理库存、订单、客户关系、财务和供应链等关键业务流程。1、提高运营效率,2、增强数据一致性,3、提升客户体验。以下将详细介绍ERP电商平台的具体功能、优势以及其https://www.jiandaoyun.com/blog/article/1496054/
6.ebay代发货是什么意思全球供应链由于内容过多,网页上无法完全展示,所以,想要了解更多的人可以加我微信: 如下所示,这是用户反馈常见ERP的优缺点和价格部分: 二、360ebay代发货是什么意思全球供应链查询 五、关于ebay代发货是什么意思全球供应链 本文为米境通erp系统发表,未经许可,不得转载。https://www.miwaimao.com/soft_1093921.html
7.电商供应链平台一件代发是什么?一件代发是一种电商模式,也称为“无库存模式”,是指消费者在电商平台上下单后,零售商将订单直接通过电商供应链平台发给供货商,供货商将商品直发到消费者手中。一件代发是一种电商模式,也称为“无库存模式”,是指消费者在电商平台上下单后,零售商将订单直接通过电商供应链平台发给供货商,供货商将商品直发到消费者https://www.cifnews.com/article/152186
8.三剑客论道之一:何谓电商平台?当中和俩位吴大哥的火花碰撞印象最深刻。什么是火花、什么是碰撞?豆腐和豆腐的碰撞是没有火花的?豆腐和水的碰撞也是没有火花的?两种特性不同而又有份量的坚硬物质碰撞起來才有看头的。现在有三个硬朗、固执的汉子,火花一定不少。 过去几年,我们在元器件供应链的数字化、数码化,电商、还是电商平台等课题,经过多次https://www.esmchina.com/news/11273.html
9.电商供应链数仓平台该如何建设?应该注意什么?51CTO博客电商供应链数仓平台该如何建设?应该注意什么? 导读:随着蜀海供应链业务的发展,供应链中各个环节角色的工作人员利用数据对业务进行增长分析的需求越来越迫切。在过去大数据分析平台架构1.0的实践中,存在数据生产链路太长,架构太复杂,开发运维成本都很高,之前的团队对这个架构的驾驭能力不足,数据冗余,对业务的适应能力较弱https://blog.51cto.com/u_15105906/5968514
10.S2bDiy柔性定制供应链平台,是小定科技旗下国内领先的PrintOnS2bDiy柔性定制供应链平台,是小定科技旗下专业的Print On Demand按需打印平台,为广大独立站、亚马逊、Etsy、速卖通、Tiktok跨境卖家提供从爆款选品-Pod设计-卖家出单-平台一件生产一件代发的一站式全链条柔性定制服务。平台全幅印花服装,定制首饰,手工艺品提供超过1000款Phttps://www.s2bdiy.com/
11.一盘货:东南亚电商最需要的供应链服务② 平台一盘货。零售型平台基于多品牌、渠道整合优势,面向终端to C消费者提供订单履约与交付,具备集货、分拣、再包装及交付能力。代表有京东、美团优选等电商平台。 ③ 供应链物流一盘货。供应链物流企业依托区域多服务场景,生态整合能力,协同多客户订单需求,形成云仓网络与服务能力,提供一盘货服务:包括一件代发、仓储、https://maimai.cn/article/detail?fid=1751549277&efid=pKn_HjkVnZYY25OTlYNJdg
12.电商市场动向电商发展趋势供销市场动态其基本原理为:消费品供应链核心企业获得供应链金融中心5000万-1个亿授信额度后,将额度切分给其合格下游商家,商家获得银行贷款后用该笔资金向核心企业采购货物,消费品供应链企业提供反担保;在商家从电商平台回笼资金归还银行贷款后,额度释放,进而循环使用。对此,网经社消费品电商供应链金融服务中心负责人曹磊表示,该方案http://2844go.com/news/market?num=1&size=30
13.如何通过成品站货源入口高效获取优质商品虽然成品网站货源入口为商家提供了便利,但要充分利用这些资源,还需要掌握一些技巧。商家应定期检查平台的货源更新情况,确保所销售的商品始终符合市场的最新需求。商家要通过数据分析,了解哪些商品的销量较好,进而优化商品的销售策略。商家还应建立良好的供应链管理机制,避免因平台供应不足或延迟发货影响销售。 http://www.aiweiyou.com/aiweiyou4/28967711b.html
14.电子商务平台对接电商供应链,不得不说的开放平台电商API接口接口需要支持根据同步状态查询订单,查询订单成功后,平台方需要将对应的订单同步状态改为“已同步”,这样可以保证每次查询的时候至查询“未同步”的订单;另外,如需查询已同步的订单也可指定对应的状态进行查询。 查询的方式需要支持按照条件查找,如:开始时间、结束时间、订单状态、同步状态等,同时也需要支持按照订单编号精https://blog.csdn.net/TinagirlAPI/article/details/134180345