电商供应链数仓平台该如何建设?哪些点需要注意?腾讯云开发者社区

蜀海供应链成立于2011年6月,是集销售、研发、采购、生产、品保、仓储、运输、信息、金融为一体的餐饮供应链服务企业,现为广大餐饮连锁企业及零售客户提供整体食材供应链解决方案服务。

我们主要业务如下图:

我们的数仓分层:

大数据团队主要负责到ODS-DWS的建设,从DWS到ADS一般是数仓系统和业务线系统的边界。

在过去,由于缺失统一的数据仓库,业务系统之间又相互依赖,业务系统那边也探索了很多模式来支持各个业务线发展。但是效果都不是很好,出现各种各样的问题,随着业务的发展,数据量也越来越大,之前的模式也越越来越不堪负重。

02

架构演进

我来公司之前这边大数据团队规模也比较小,业务量也没那么大,当时只是为了支撑海底捞门店补货系统(几家门店试点),搭建了基于CDH一套大数据平台,主要是为了完成每十分钟给补货系统推送一批计算好的数据,主要是POS销售数据,沽清数据等,每天在全量的推送一次一整天的数据,当时的架构如下:

这是当时的大数据架构,为了解决这个问题,基本上能用的组件都用了,但是数据的实时性还是满足不了需求。

这个架构存在的问题:

①为什么选择Doris?

我来蜀海之前就是Doris的用户,深知Doris的优点,在这里还是说一下。

对我们用户来说,Doris的优点是功能强大,易用性好。功能强大指可以满足我们用户的需求,易用性好主要指兼容Mysql协议和语法,以及OnlineSchemaChange。兼容Mysql协议和语法让用户的学习成本和开发成本很低,OnlineSchemaChange也是一个很吸引人的feature,因为在业务快速发展和频繁迭代的情况下,Schema变更会是一个高频的操作。

对我们平台侧来说,Doris的优点是易运维,易扩展和高可用:

如下图:

下面这个图可能更清晰的看清楚我们基于Doris的数据流向

我们基于Doris开发了自己的数据中台,主要是为了解决以下五个问题:

围绕上面这五个问题,我们设计和开发了公司的数据中台,下面主要介绍基于Doris开发数据中台过程中我们做的一些工作。

我们这边业务库基本都是Mysql,也有非Mysql数据库,基于这种情况,我们采用了Canal及Datax完成数据采集,同时对Datax进行了改造,是Datax抽取的数据格式和Canal一致,然后通过Flink基于DorisStreamLoad完成数据入仓操作,整个过程可以零代码完成,并集成了我们自研的规则引擎,实现规则自定义及规则自动下发到FlinkJob中,具体展示效果如下:

数据分析人员可以通过Web方式零代码完成业务数据接入,最后提交任务即可。

目前支持Mysql,Kafka,Datax,这里我们采用的是Canal实现对Mysqlbinlog进行监控,然后将mysql的数据实时推送到Kafka,接入任务可以监控,接入数据量可监控

数据接入到Doris数据仓库对应的表中,这里我们采用的是Flink实时消费KafKa的数据,然后通过Doris的StreamLoad完成。Flink消费Kafka数据我们支持两种方式:

针对FlinkJob失败,可能会造成数据丢失的问题,我们解决方案如下:

因为我们这个是在数据接入层使用的,数据是进入到数据仓ODS层,在这一层我们采用的是DorisUniqueKey模型,就算数据重复入库,也会自动覆盖原先的数据(这是DorisUniqueKey模型的特点),不会出现数据重复的问题。

提供内置规则模板,及规则定义可视化开发界面,规则试跑,规则发布等,发布的规则会自动下发到FlinkJob对应的作业中执行。

2.基于Doris数仓的元数据管理

基于Doris我们实现了元数据管理(业务元数据及技术元数据),提供物理元模型及血缘元模型的构建,提供一键搜索的数据地图服务。

血缘关系:通过解析Doris审计日志,自动化完成

关联关系:这个主要是在ODS(贴源层),因为业务系统数据库表没有主外键关系,在这里我要知道数据之间关联关系,通过手动定义维护。

我们为了快速响应业务系统的数据服务需求,设计开发了接口零代码开发平台,数据分析人员不需要写代码就可以快速完成API接口的开发,可以对接口进行可视化上下线操作,接口调用限制(黑白名单),支持降级限流熔断等,快捷方便,高效。

在指标系统完成基于审批流程的指标规范化定义,严格定义指标规范,规避指标二义性;支持和其它产品联动影响和展示,产品如模型设计中心、数据地图等。

我们将海豚调度深度集成到我们的数据中台中,各个模块可以很方便的将任务添加到海豚调度系统中运行及监控。

为了让Doris更好的适应各种异构数据的融合分析,使用大规模分布式环境下的机器学习场景及实时数据分析的场景,我们设计并发了FlinkDorisConnector,同时贡献给了社区。具体的实现方案通过主数据分区来并行执行,大大提高了读取的速度和效率。同时通过FlinkSQL方式读写Drois数据。读数据主要进行异构数据源的关联分析,在回写到Doris数仓里面去。

详细的设计方案可以参考我的博客:「FlinkDorisConnector设计方案」

04

收益

目前10台BE,3台FE(高可用)的Doris环境,效率、性能表现情况如下:

THE END
1.电商市场动向电商发展趋势供销市场动态其基本原理为:消费品供应链核心企业获得供应链金融中心5000万-1个亿授信额度后,将额度切分给其合格下游商家,商家获得银行贷款后用该笔资金向核心企业采购货物,消费品供应链企业提供反担保;在商家从电商平台回笼资金归还银行贷款后,额度释放,进而循环使用。对此,网经社消费品电商供应链金融服务中心负责人曹磊表示,该方案http://2844go.com/news/market?num=1&size=30
2.2024年你能做的7个跨境电商平台!1.美国第二大跨境电商平台,沃尔玛Walmart每月有超过1.2亿独立访客量的高流量。 2.目前沃尔玛卖家数量相对较少,竞争压力也小,很适合各大跨境电商品牌进驻。 3.沃尔玛没有月租金,佣金比例低至5%,最大程度让利卖家。 4.供应链体系强大,WFS两日达物流可给予卖家更优秀的物流保障; https://www.captainbi.com/amz_college_info-2662.html
3.一盘货:东南亚电商最需要的供应链服务② 平台一盘货。零售型平台基于多品牌、渠道整合优势,面向终端to C消费者提供订单履约与交付,具备集货、分拣、再包装及交付能力。代表有京东、美团优选等电商平台。 ③ 供应链物流一盘货。供应链物流企业依托区域多服务场景,生态整合能力,协同多客户订单需求,形成云仓网络与服务能力,提供一盘货服务:包括一件代发、仓储、https://maimai.cn/article/detail?fid=1751549277&efid=pKn_HjkVnZYY25OTlYNJdg
4.S2bDiy柔性定制供应链平台,是小定科技旗下国内领先的PrintOnS2bDiy柔性定制供应链平台,是小定科技旗下专业的Print On Demand按需打印平台,为广大独立站、亚马逊、Etsy、速卖通、Tiktok跨境卖家提供从爆款选品-Pod设计-卖家出单-平台一件生产一件代发的一站式全链条柔性定制服务。平台全幅印花服装,定制首饰,手工艺品提供超过1000款Phttps://www.s2bdiy.com/
5.2024年农村电商怎么搞?关注这14条政策措施推动数字赋能供应链下沉,继续支持新能源汽车、绿色智能家电、绿色建材和家具家装下乡,促进大宗商品更新换代。 三、拓展农村数字便民服务 引导电商平台、快递企业通过供应链管理、门店升级、品牌合作等方式,改造升级农村便利店、小超市等。 鼓励将农村电商服务站点升级为供应链中转仓、直播电商场所、前置仓等,充分盘活现有设https://m.gmw.cn/2024-03/14/content_1303685129.htm
6.4500+资源免费对接:乘风破浪的姐姐直播招商滴滴寻品牌实物15、【魔法灯跨境电商】跨境电商平台,欢迎各类个人,渠道合作: 我需要: 1,各类线上线下渠道合作 2,社交电商,兼职创业者 3,可以进行供应链对接 我提供:免费提供社交电商开店分销系统,带社群培训,6000+澳洲、新西兰等地母婴,保健品,美妆产品 16、【赤兔】淘系工具类资源互换: https://www.niaogebiji.com/article-27383-1.html
7.2018(第二届)中国汽配供应链大会暨金登杯金链奖颁奖盛典启航!2018年11月26日,由汽配圈、法兰通联展览(北京)有限公司共同主办的“2018(第二届)中国汽配供应链大会暨金登杯金链奖颁奖盛典”在上海大华虹桥假日酒店盛大启航。 本次大会以“突围”为主题,邀请了40余名行业重磅嘉宾,来自供应链连锁&电商平台、国际国内知名厂商、供应链服务商(数据、软件公司等)、终端、协会等近60http://www.cheyun.com/content/24850
8.平台3000个京东苏宁天猫工厂网批账号专卖店账号工厂高级供应链京东令牌京东苏宁天猫工厂网批专卖店集采专供,3000个一站式供应链货源,经营系统搭建,365流量系统,全国实体店批发商创业者,副业,资源项目,百元创业项目,千元创业项目https://www.yyq1668.com/