对于大数据与人工智能行业的数据架构、数据效能、算法创新、智能应用四个层面,大模型将带来哪些影响?
只有两条主线,变与不变。
变
湖仓一体、OLAP,更彻底的向量化改造与大规模集群建设
数据治理,更严格的数据质量要求
对话、办公与数据分析,基于语言的开发与交互模式变革
推荐系统,每个模块推倒重来
游戏与AIGA,从语言交互走向行为交互
预训练、微调、提示、数据飞轮,大模型重构AI模型开发
不变
数据存储与计算,不变的确定性逻辑
指标体系与AB实验,不变的增长主题
图机器学习,不变的复杂性
知识图谱,不变的知识沉淀
推荐系统,不变的召回、排序
金融,不变的可信与安全核心
大模型,不变的数据壁垒、深度学习底层缺陷与成本计算
数据架构方面,为了适配大模型训练的离线计算特点,大数据基础设施在追赶流式、实时性上暂缓脚步,而在集群规模、稳定性、吞吐量等方面做着重优化,计算、存储上也在往向量化的方向改造,数据、代码、语言都在向量化,很快推高了向量数据库的热度。
数据效能方面,人们开始探索大模型在AB实验、数据治理方向上的应用,包括写代码、拟定方案框架、输出标准等任务。
算法创新方面,震撼于大模型的成功,图机器学习领域正借鉴着Transformer的建模思想,在可扩展性上积极探索。
知识图谱与大模型相辅相成,后者拥有生成知识的能力,前者也能增强大模型的准确率,缓解幻觉问题,不少人甚至预估大模型将取代知识图谱。
大模型的工程落地正如火如荼,基于大模型可以快速通过输出反馈输入迭代优化即形成数据飞轮的特点,数据这个AI界的里子终于取代算法,成为AI界的“高级词汇”。早已趋近成熟的AI基础工程,因为大模型的到来,即将被推倒重塑,MLOps被LLMOps取代,未来是否所有算子都属于Transformer的进化树?开源大模型的蓬勃发展,几乎不逊于ChatGPT的表现,令人猝不及防的内卷速度,迅速成为了大模型竞争的另一极力量。闭源还是开源,是一个问题。
智能应用方面,ToC领域的任何一个角落,都要直接面对大模型重塑的趋势,以互联网大厂为主体的企业都在穷追猛赶,希望在每个细分场景抢落第一个案例,并迅速占有规模优势。
大模型的自然语言理解和代码理解能力,让企业看到了在晶体管发明以来之后的新一轮生产力革命,自然语言可以和代码连接,而代码可以和所有技术逻辑连接,办公、管理、开发从未离得如此近,一人一公司的超级生产者即将出现?而在海量的、大跨度的文本资料面前,大模型又是否有本事吞下金融这头巨兽?
推荐系统,作为国内移动互联网时期的王牌应用,其基于大模型的改造正作为超高优先级项目全面展开,召回、粗排、精排、重排,都可以变成大模型召回、大模型粗排、大模型精排、大模型重排。
自然语言交互模式降低了不同主体交流的门槛,除了人机交互,AI与AI的交互,AI与环境的交互,乃至AI与人、环境的交互,都建立了新的高速连接,以游戏和机器人等领域为代表。
但尽管如此,大模型也不可能改变一切,有太多的“仍然”。
大数据架构中,存储与计算没有被概率逻辑取代,仍然在为复杂的分布式与事务性逻辑苦恼。
AB实验、数据治理的高阶逻辑和决策阶段,仍然必须由人类执行。
超级生产者背后的人类,自然也是不可或缺的。
为了企业的业务增长,人类仍然要兢兢业业地写OLAP、建指标、设计产品。
图机器学习的架构不会被完全Transformer化,从物理学的对称性继承而来的几何深度学习仍然表现出对空间概念学习的优势,对基于序列性表达的大语言模型,自然没有那么擅长空间逻辑。
知识图谱不可能被一朝取代,其存量价值仍然不可限量。
推荐系统,并没有被全栈取代,目前只看到了部分取代升级的可能性。
风控中的恶意团伙识别,因数据跨度大、维度高,如何用大模型建模都是个难题。
NPC内容生成在游戏中只是个非常基础的应用,3D生成才是有变革性的技术,但基于大模型的3D生成质量仍然很粗糙,可控性很差。
结合机器人的具身智能大模型虽然被认为是通向AGI的路径,但仍然停留在研究阶段。
ToB领域的企业则发现了大模型在面对高复杂场景时的性能波动,正在计算投入产出比以及精打细算。
大模型自身,仍然要面对缺乏因果关系、幻觉、恶意行为诱导、数据泄露等根本难题,这一直是老生常谈,这也将限制其在ToC应用的扩展速度。
大数据与人工智能行业,整体的主题仍然是降本增效。各类引擎趋于统一,数据架构变得精简,持续进行云原生改造,数据治理越发精细化,深入到内核中。大模型的作用,从产业角度看,也是降本增效优先。
但无论如何,也别小瞧大模型。大模型是一种变革性力量,未来局面仍然不可知,大模型的应用潜力的边界仍然未清晰。
这也是本次大会希望亲自见证的,大模型为大数据与人工智能行业和实践者带来的变与不变。
大会详情
议题详情
林伟阿里云计算平台事业部首席架构师,阿里云人工智能平台PAI&数据开发与治理平台DataWorks负责人
个人介绍:林伟,主攻大规模分布式训练加速、编译优化、大数据计算、分布式系统等技术工程建设和性能优化。具有17年的系统架构设计及研发经验,并在国际一流ODSI、NSDI、SIGMOD会议上多次发表论文。原微软大数据平台组的核心成员,曾在微软亚洲研究院和微软美国工作10年。
演讲题目:大数据AI一体化解读
演讲提纲:
1.围绕模型研发全生命周期的数据计算体系
2.大数据AI一体化的应用场景
3.大数据AI一体化的技术实现
杨青度小满技术委员会执行主席、数据智能应用部总经理
演讲题目:金融大模型技术创新与应用探索
1.大模型简介
2.开源轩辕大模型详解
3.金融大模型应用探索
4.总结与展望
听众收益:详细了解国内开源金融大模型的研发过程,了解大模型在金融行业中如何应用,对自研大模型以及使用大模型都有帮助。
肖仰华复旦大学教授,上海市数据科学重点实验室主任
个人介绍:肖仰华博士,复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、知识图谱研究。发表CCF-A、B类等论文200余篇。出版学术专著与教材三部。完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任AppliedIntelligence等多个国际期刊副主编或编委。
演讲题目:走向千行百业的大模型
1.定位与认识
2.场景与应用
3.成本与价值
4.对策与路径
听众收益:详细了解大模型在领域应用中所能胜任的场景和角色,了解使用大模型技术的成本与收益,帮助听众更好地制定适合自身业务发展的策略和路径规划,以迎接大模型技术对行业带来的挑战与机遇。
圆桌主持人:刘一鸣阿里云大数据产品负责人
个人介绍:刘一鸣,目前负责阿里云ODPS等自研大数据产品,主攻云原生一体化数仓引擎能力的演进和商业化,在数据仓库、大数据计算、开源大数据行业有15年以上工作经验。原Kyligence副总裁,ApacheKylinPMC。
出品人:王鑫蚂蚁集团大数据部实时数据负责人
个人介绍:ASFMember,ApacheStorm&IncubatorPMCMember,ApacheRocketMQ&IoTDB&StreamPipesCommitter,蚂蚁集团大数据部实时数据负责人。
杨嘉义字节跳动LAS查询引擎负责人
个人介绍:曾在百度智能云、大数据等部门从事数据分析和服务、数据科学等工作,拥有十多年的开发和架构经验。当前负责字节跳动火山引擎LAS底层的湖仓一体加速引擎Bolt和Presto方向。
演讲题目:湖仓一体加速引擎Bolt及在字节跳动火山引擎LAS的应用
1,Bolt的背景和意义
2,Bolt的架构设计
3,Bolt的核心特色
4,Bolt在火山引擎湖仓一体产品LAS的实践
听众收益:
1,了解基于向量化和编译优化的Bolt加速引擎,如何获得2x加速比和40%资源节约。
2,了解火山引擎湖仓一体产品LAS的架构、特色及应用场景。
3,了解Bolt在湖仓一体产品LAS的应用现状及主要收益。
王日宇阿里云高级软件开发工程师
个人介绍:计算机科学与技术硕士,专注于大数据系统和OLAP数据库的技术研发工作,现在主要负责开源StarRocks项目内核开发。
演讲题目:基于StarRocks和Paimon打造湖仓分析新范式
1.数据湖技术发展的演进介绍
2.使用StarRocks+Paimon湖仓分析方案主要场景介绍
3.使用StarRocks构建Paimon物化视图和数据湖分析的关键技术原理介绍
4.使用StarRocks+Paimon湖仓分析能力的未来技术规划
1.了解数据湖技术发展的演进
2.了解如何使用StarRocks+Paimon构建湖仓分析方案
3.了解StarRocks+Paimon湖仓分析的核心技术原理
蒋晓峰哔哩哔哩基础架构部资深开发工程师
个人介绍:哔哩哔哩资深开发工程师,ApachePaimonPPMC,ApacheKyuubi&RocketMQCommitter,主要负责哔哩哔哩RemoteShuffleService。
演讲题目:ApachePaimon:实时数据湖StreamingLakehouse的存储特性解读
1.实时数据湖痛点剖析
2.ApachePaimon架构概览
3.ApachePaimon特性解读
4.ApachePaimon入湖实践
5.ApachePaimon规划展望
了解实时数据湖StreamingLakehouse的存储底座概况,熟悉ApachePaimon实时数据湖的架构原理和实践案例。
出品人:景生军YY直播大数据负责人
个人介绍:景生军,百度YY大数据负责人。多年大数据从业经验,对数据基础架构服务、数据资产化、数据应用具有深刻的洞见。
邓琴丰YY直播数据产品负责人
个人介绍:目前负责YY直播数据产品的总体规划,带领团队落地包括数据开发管理、数据治理、数据分析、数据服务、用户画像及运营分析等数据平台及应用产品;有10年+的大数据分析及产品经历。
演讲题目:YY直播业务指标治理实践
演讲提纲:烟囱式的需求开发沉积大量数据模型及数据报表;而业务指标管理存在技术口径和业务口径混用,同名不义及同义不同名等问题;通过业务指标的体系化梳理及构建,引入指标生命周期管理机制,清理融合存量数据模型及报表;最终面对业务用户,构建以指标目录为入口的自助购物式的数据获取及分析体验,提纲如下:
1.存在的问题及原因分析
2.业务指标体系化构建
3.业务指标管理驱动数据治理
4.自助购物式的指标分析
1.如何梳理并构建业务指标体系?
2.如何利用指标管理驱动数据治理?
3.指标管理产品构建及运营的实战经验
韩钰腾讯大数据平台部数据上报系统负责人
个人介绍:硕士毕业于中国科学院计算机网络信息中心,曾先后就职于百度、滴滴、腾讯等公司,目前在腾讯数据中台负责数据上报系统,深耕数据上报质量和效率,实现PCG的全业务覆盖。
演讲题目:数据采集治理
1、引子
1)数据采集的深广准决定了指标应用的能力上限,指标治理需要从采集源头开始
2)数据采集其实就做一件事:将真实的客观世界数字化并记录下来
3)做好数据采集的终极目标是质量和效率
2、质量
1)数据质量问题60%~80%发生在采集阶段,在指标应用阶段才发现质量问题会让人气馁,排查也很低效
2)新一代数据质量审查工具,让人们对数据质量的认知从合规检查提升到合理分析
3)质量审查能让人一眼看穿数据质量,让指标使用方可以放心大胆的使用采集数据
5)行为诊断可用来帮助诊断一些数据采集的疑难杂症,通过可视化单个用户的全部行为轨迹
6)补充其他质量工具,总结实践经验
3、效率
1)效率瓶颈很多时候并不在开发上,而在对需求的梳理、沟通、反复修改、录入、验收,以及后续长久的维护上
2)定义终端数据采集模型,在事件的基础上增加页面和元素,标准化采集口径,约定大于灵活
3)实现在线文档与需求面板的同步,既利用了在线文档的便捷,又能在需求面板中完成Diff对比、测试验收等操作
4)利用采集SDK帮助提升开发效率,用一套API引导开发者按采集模型来埋点,可选的用自动和半自动采集来减轻开发负担,搭配一套高效的测试诊断工具
5)建立退出机制,基于ROI(血缘热度/成本)的生命周期管理
4、展望
1)质量和效率我们在路上
1、了解新一代数据质量审查工具,让人快速看清数据质量,让机器自动发现问题
2、了解如何才能把数据采集的效率做好
谢凝华为技术专家
个人介绍:华为翻译中心技术专家,华为机器翻译产品和数据负责人,中国翻译协会翻译技术委员会副主任委员。于2006年加入华为,有丰富的机器翻译产品开发和数据构建经验。
演讲题目:机器翻译数据增强实践
演讲提纲:介绍华为翻译中心在机器翻译任务上的数据处理、数据增强实践。
1.如何提升机器翻译训练数据的质量。
2.哪些是更有效的机器翻译数据增强策略。
傅正佳Alluxio研发负责人
演讲题目:简化并加速AI/ML模型训练&推理的数据访问
1.AI/ML工作流在访问数据时的挑战
2.针对分析和AI的高性能数据访问层介绍
3.使用Alluxio进行模型训练的主要场景和价值
听众收益:了解全新的AI/ML训练解决方案,通过构建高校的数据平台架构快速生成分析结果。
周国峰NVIDIADevTech研发经理
个人介绍:2014年毕业于中国科学院。毕业后加入NVIDIA至今,任DevTech团队研发经理。主要负责中国区大客户技术项目合作和技术研发。
演讲题目:TensorRTLLM介绍
演讲提纲:TensorRTLLM是NVIDIA加速LLM推理的开源解决方案。TensorRTLLM提供了python接口,灵活的模块化组件,丰富的预定义主流模型,极大地方便了开发者在NVIDIA平台上部署基于LLM的服务;同时,NVIDIA投入了大量工程师对TensorRTLLM做了极致优化,包括主流的量化算法(smoothQuant,GPTQ,andAWQ),in-flightbatching,Tensor和pipeline并行等推理加速优化方法。TensorRTLLM除了具备业界领先的推理性能,同时也在不断提高它的易用性。
1什么是TensorRTLLM
2TensorRTLLM主要特点
3如何使用TensorRTLLM
4TensorRTLLM性能
5TensorRTLLM展望
1理解TensorRTLLM产品定位
2熟悉TensorRTLLM主要功能和使用方法
3了解TensorRTLLM主要优化手段
吴章淋华为NLP算法研究工程师
演讲题目:盘古大模型微调实践
1.什么是大模型
2.大模型发展历程
3.大模型微调目的
4.大模型微调技术
5.大模型微调加速方法
6.大模型微调效果提升手段
1.如何进行大模型微调?
2.如何加速大模型微调?
3.如何提升大模型微调效果?
大模型行业实践
出品人:费浩峻奇富科技首席算法科学家
陈祖龙阿里巴巴企业智能算法负责人
演讲题目:EILaw:面向企业法务数字化的中文LLM
1.企业法务数字化介绍
2.企业法务数字化挑战&难点
3.EILaw
3.1EILaw法务LLM的数据
3.2EILaw法务LLM的训练
3.3EILaw法务LLM的效果
4.EILaw业务落地&实践
5.法务数字化展望
了解企业法务数字化的进程,同时完成的了解企业法务LLM模型训练以及产业落地。
杨剑奇富科技高级算法总监
演讲题目:业务理解和逻辑推理是金融行业大模型运转的动力
演讲提纲:金融行业几乎是众多行业中,最早进行数字化的行业,科技一直伴随着金融行业的发展,而大模型的运用将带来金融的科技属性的又一次飞升。金融行业的大模型和其他行业最大的区别,在于金融行业的业务复杂程度、行业经营规范的要求以及安全隐私保护上。并且金融场景中有很多业务判断要求十分严谨,容错率很低,对于当前大模型的能力是一个挑战。金融业务在实际经营过程中,不仅需要有总结归纳和表达输出的能力,更要具备逻辑推理的能力,而支持逻辑推理落实,并做出差异化的方法,是通过结合私有化的领域知识图谱构建的思维链、思维树或思维图。同时面对各类复杂金融业务场景,也不是单纯算力、数据和参数规模的比拼,而是要针对具体场景,利用对业务的理解,有区别化、精确化的挑选参与模型预训练、指令精调、进行RLHF所需的数据。产出的大模型所扮演的角色,也应该是单一或者有限几个领域的专家。
1、科技是金融行业发展的动力,大模型是助推金融科技能力提升的又一个助推器
2、金融行业大模型的特殊性及其难点与挑战
3、利用科技属性以及科技优势提升金融行业大模型效果
4、面对挑战,金融行业大模型可以解决哪些问题
1、理解金融行业大模型与其他行业的差异性
2、理解金融行业大模型在落地过程中存在哪些难点
3、理解如何发挥科技优势,提升金融行业大模型效果
4、理解金融行业大模型在金融业务开展中扮演哪些角色
陈炜于阅文集团技术副总经理
演讲题目:当好故事插上大模型的翅膀
ben.huang某头部汽车公司人工智能专家
个人介绍:中科大硕士,曾服务于百度腾讯等互联网大厂,在大数据人工智能领域有十多年经验。
演讲题目:大模型在汽车行业的应用与实践
1.GPT的应用范式
2.AIAgents及工作机制
3.汽车行业的最佳实践
4.GPT未来思考
1.深度理解GPT应用范式
2.深刻理解AIAgent和工作原理
3.学习如何利用GPT实现业务创新
4.熟悉GPT在汽车行业的最佳实践
出品人:焦学武百度主任架构师
个人介绍:焦学武,毕业于中科院计算所。现任百度主任架构师,百度商业体系机器学习平台负责人。先后负责百度凤巢检索架构、模型训练平台等工作。带领团队完成了具备业界开创性的DNN模型框架PaddleBox、图模型框架PGLBox、特征框架FeaBox、自动寻优平台AutoML等工作。曾多次获得最佳百度人、百度总TC技术创新奖、商业体系最佳项目奖、业务进攻奖等荣誉,在KDD、BigData等人工智能顶级会议上发表多篇论文。
胡伟百度资深研发工程师
个人介绍:胡伟,百度资深研发工程师,百度大商业图模型方向负责人。
演讲题目:超为异构图的表征学习及应
1.背景和现状(面临的挑战)
2.解决方案和技术创新
3.收益和落地
1.如何优化图存储
2.如何加速图模型训练
3.如何优化多机通信的性能
于翔新浪微博资深算法工程师
个人介绍:于翔,新浪微博机器学习平台深度学习框架负责人,目前主要负责机器学习平台的大规模稀疏模型训练推理服务、图深度学习系统等。
演讲题目:大规模图深度学习训练在新浪微博的工程落地实践
听众收益:了解大规模GNN遇到的训练挑战与解决方案。
姚亮腾讯高级研究员
演讲题目:腾讯游戏的图学习研究与落地
1.大规模图学习算法PB-GNN
2.链路预测算法的研究与应用落地
3.大语言模型在知识图谱补全的应用
听众收益:熟悉大规模图学习算法,链路预测算法,图预训练算法、大语言模型和知识图谱的结合。
黄泓Akulaku资深算法开发工程师
个人介绍:毕业于代尔夫特理工大学,专注于图计算与知识图谱在Akulaku各种智能应用的落地。
演讲题目:图计算在Akulaku智能风控中的应用
1.Akulaku的应用场景简述
2.应用场景分类与系统设计
3.应用场景举例
4.总结
1.图计算在智能风控场景落地的难点与方案
2.图计算与大模型融合的可能方向
出品人:陈峭霖腾讯游戏首席数据科学家
个人介绍:北京大学学士,UCLA生物统计系博士,2后在诺华制药任首席统计师,从事临床试验统计分析和医药大数据研究;2017年加入SparkBeyond任资深数据科学家,为世界五百强企业提供可落地的大数据解决方案。2018年加入腾讯游戏数据挖掘团队,目前致力于游戏出海领域的机器学习、GenAI、推荐系统、用户画像、知识图谱等的研究和应用,同时打造业界领先的游戏领域通用数据挖掘平台。
刘文强腾讯IEGGlobalManager
个人介绍:刘文强在18年博士毕业之后加入腾讯,曾负责游戏领域知识图谱构建和应用。现任腾讯IEGGlobal算法中心NLP组长,主要负责多语言自然语言处理的算法研发以及在腾讯海外游戏的应用设计和开发工作。
演讲题目:Game+Agent我们的初步尝试
1.Agent的整体介绍
2.Agent的技术架构拆解
3.我们在Agent上一些尝试
1.了解目前Agent的一些主流进展
2.了解目前Agent的技术细节
3.具体如何实践
关凯网易伏羲资深人工智能工程师
个人介绍:硕士,毕业于浙江大学计算机系。于18年3月加入网易伏羲,自21年中起负责强化学习落地方向。其专注于优化GameAIBot的表现及策略,提升玩家游戏体验。目前成果已在多款网易雷火的游戏落地应用,如:永劫无间、逆水寒(端游、手游)、全明星街球派对,倩女幽魂(端游、手游)等。
演讲题目:GameAIBot在PVP场景中的应用与实践
1.PVP类游戏GameAIBot的应用场景及案例引入
2.如何生产满足需求GameAIBot
3.如何应用GameAIBot及其结果
4.工作展望
1.了解PVP类游戏对GameAIBot的需求及其痛点
2.了解现阶段的GameAIBot的生产流程
3.了解GameAIBot如何联合游戏匹配系统进行应用
AlexisRolland,UbisoftChina,DevelopmentDirector
AlexisRolland,自2012年加入育碧,曾先后在大数据、数据分析和机器学习等领域担任多个关键职务。目前,作为LaForge中国团队开发总监,他领导着团队在技术创新领域迈出坚实的步伐。出于对新兴科学技术的执着追求,Alexis一直致力于架起学术前沿和视频游戏产业之间的桥梁,尤其在积极推动育碧生成式AI助力内容创作的革新中,发挥着关键的作用。
演讲题目:Pioneering2DimagegenerationforAAAgames(助力3A大作:领跑2D图像生成技术)
本次演讲将介绍育碧(Ubisoft)在为3A游戏创建专有图像生成式模型方面的方法。
演讲内容将包括以下部分:
为什么需要创建微调图像生成式模型
育碧的方法和方法论
介绍CaptionStudio实用工具
展示图像生成式模型
吴立炎凰数据研发工程师
演讲题目:使用JIT技术实现高效的数据库表达式求值
1.介绍数据库表达式求值的一般方法
·什么是表达式求值问题
·常见方法如向量化/JIT/树遍历等
·不同的数据库的解法
2.JIT即时编译技术
·什么是JIT即时编译技术
·JIT技术的优缺点
3.使用Gandiva表达式编译器
·介绍ApacheArrow
·介绍Gandiva表达式编译器,LLVM及其工作
1.如何对数据库表达式求值
2.JIT即时编译技术的基本概念以及为什么需要JIT
3.如何使用ApacheArrow/Gandiva的JIT即时编译技术加速计算
AlexeyMilovdov,ClickHouseCTO/谢志豪ClickHouse技术支持工程师
个人介绍:
Alexey毕业于莫斯科国立大学,拥有数学学位。他的兴趣领域包括数据处理算法和技术,他热爱数据和高性能。拥有13年的设计、开发和操作数据密集型应用程序的经验。他于2009年开始着手ClickHouse初始模型的策划和开发,并于2016年将其释放为开源项目。在ClickHouse之前,他开发了全球第二大网络分析系统的数据处理引擎。
Derek谢志豪是ClickHouse的技术支持工程师。主要工作范围包括帮助大型客户解决重大技术问题,优化Clickhouse集群,提升使用体验。Derek毕业于新加坡国立大学(NUS)获得信息系统学位,在ClickHouse工作之前一直从事数据平台的优化和管理工作。
演讲题目:ClickHouse2024新功能与研发方向思考
出品人:王海华货拉拉大数据基础架构负责人、大数据架构师
何洋货拉拉大数据专家
演讲题目:货拉拉大数据下一代基础架构实践与思考
1.背景与挑战
2.基础架构实践
3.总结与思考
4.未来展望
1.面对资源波峰低谷,如何在成本和资源效率间平衡
2.除了x86服务器,我们还有别的选择么
3.面向云原生浪潮,大数据架构如何演进
贾承昆知乎数据平台负责人
演讲题目:知乎大数据跨机房实践
演讲提纲:介绍知乎大数据跨机房方案,如何在多个机房之间迁移数据,调度计算作业并保障稳定性。
1.如何设计并实现Hadoop跨机房方案
2.如何在多集群之间进行快速的数据迁移
3.如何在多集群架构下保障稳定性
罗明波vivo互联网大数据专家
演讲题目:vivo超大数据规模下分布式消息中间件架构演进实践
1.十万亿级消息中间件架构演进实践
2.消息中间件监控告警实践
3.分布式消息中间件Pulsar核心架构升级
4.分布式消息中间件Pulsar新特性
1.了解vivo分布式消息中间件平台及监控告警体系建设;
马吉辉永辉超市大数据架构师
个人介绍:马吉辉,永辉超市大数据架构师,数据中台OLAP架构负责人,永辉CLICKHOUSE布道者,毕业于南京大学计算机系,2019年加入永辉云创数据智能产品研发部,从0到1构建永辉线上大数据计算体系,离线、准实时、实时数仓架构,2020年主导并参与了永辉数智化转型之路,构建永辉数据中台,数据中心"蓄水池",高效赋能业务增长。多年大数据从业经验,对数据基础架构服务、数据资产化、数据应用具有深刻的洞见。目前专注于数据治理,自助取数分析-人人都是数据分析师的体系建设落地。基于永辉"极光"平台实现业务输出。
演讲题目:零售行业永辉超市云原生数据中台的探索与实践
1.永辉数据中台的经路历程
2.以数据赋能零售业务的探索与实践
3.数据治理思维驱动数据中台稳定高效
1.了解零售业数据中台私有云建设的探索与实践
2.了解数据治理在数据中台中的思维体现
3.了解数据如何赋能复杂的零售业务变化
4.对零售业技术的未来的探索与实践
曾昭正顺丰科技大数据平台技术专家
演讲题目:混合云原生大数据底盘
1、背景与趋势
2、顺丰混合云原生数据架构升级
3、顺丰大数据架构应用案例
1.多云融合的大数据基础设施如何做到低成本
2.Hadoop与云原生架构如何做融合
3.跨机房离线任务如何保障计算效率
高大月火山引擎ByteHouse技术专家
个人介绍:2020年加入字节跳动ByteHouse团队,先后负责过ByteHouse的表引擎和架构工作,曾参与过多个开源OLAP项目,有近10年的大数据和OLAP内核研发经验。
演讲题目:火山引擎ByteHouse的云原生探索与实践
1.数仓架构演进历史
2.云数仓演进中的技术难点和问题
3.ByteHouse云数仓架构设计以及存算分离的关键技术
4.ByteHouse存算分离的实践与优化
1.了解云原生数仓的发展与核心价值
2.ByteHouse云数仓的架构设计与技术亮点
3.云原生数仓的挑战和展望
雷春蔚阿里云MaxComputeSQL引擎技术专家,ApacheCalcitePMC
个人介绍:雷春蔚,ApacheCalcitePMC,具有多年大数据从业经验,主攻SQL引擎性能优化,先后负责了阿里云MaxCompute物化视图、dynamicfilter、索引等核心功能的设计和开发。
演讲题目:物化视图在MaxCompute中的探索与实践
出品人:黄帆腾讯专家研究员
张启华虎牙直播推荐算法工程师
个人介绍:目前就职于虎牙,之前先后在百度和腾讯工作,一直从事推荐算法领域,尤其对重排/混排算法有较深的理解与创新。在业界首次提出把强化学习应用于多目标融合领域的方案,随后在腾讯多个产品有效果显著的落地应用,后续也有多家公司跟进应用,该成果整理成论文发表在数据挖掘领域国际顶级学术会议KDD2022上,引起较大反响,在这一领域开创了一个全新范式,大幅提升了效果天花板。
演讲题目:强化学习在推荐系统中的实践探索与业界进展
1.推荐系统与强化学习
a.强化学习概述,及其应用领域
b.推荐系统的传统方法及当前挑战
c.强化学习与推荐系统的结合点:交互性与长期满意度
(讲述结合的动机,推荐系统通过不断增加预测任务并拓展目标周期,以提升对用户的长期满意度,而强化学习的交互性及长期价值建模有助于推荐系统实现该目标)
2.探索强化学习在推荐系统中的应用
a.推荐问题的强化学习建模
b.面临的核心挑战
i.推荐系统的动态性与复杂性
ii.延迟奖励与复杂的环境反馈
c.常见的强化学习实践方案,优势及局限性
d.离线强化学习的实践探索
i.OfflineRL的训练框架
ii.不同范式的OfflineRL模型算法
iii.离线评估方法
(以踩坑过程为线索,介绍建模方法,在探索过程中遇到的一些问题,分布偏移、外推误差,模型训练困难,线上效果不稳定等等。介绍一种成功案例的OfflineRL的流程框架)
3.业界的新进展与进展
b.新的算法与技术概述
c.未来展望,一些可以尝试的方向畅想
肖玄基Shopee内容电商算法负责人
个人介绍:毕业于中科院软件所,目前在Shopee负责电商直播为主的内容电商算法,曾在腾讯,阿里,百分点工作过。主要研发方向包括推荐,内容生态,用户增长,营销等。
演讲题目:面向2026年的推荐算法前瞻
常规的推荐系统范式已经逐渐走入瓶颈,原因是在当前固定化的问题描述下模型和系统几乎已经发展到极限。当前的主要范式是模型是召回+排序+重排,系统上是样本挖掘+特征工程+线上打分预估能力建设。一线大厂在上述领域已经把空间几乎挖掘殆尽。
同时可以看到,我们的用户仍然对当前推荐系统满意度并没有达到理想态。推荐系统是一个非常面向于用户满意的平台系统,而用户满意是一个永远有不同理解的问题,正如“一千个用户眼里有一千种好的推荐系统理解”。同时,我们的推荐系统效果和平台的最终价值之间仍然存在差距。
构建更好的推荐系统需要我们对重新定义“什么是好的推荐系统”。
这并不是学术界的“强行挖坑”或者“继续填坑”,而是不同层面上都在呼唤新的定义。
事实上,新的推荐系统已经零散的在学术界和工业界展现星星之火。
1)了解未来3年的推荐系统前沿问题,把握大局方向。
2)参与我们的推荐算法的github开源项目:OneRec。
孙嘉琨腾讯音乐推荐算法工程师
出品人:吴小前滴普科技CTO
个人介绍:吴小前,滴普科技CTO,资深技术专家,负责前沿技术研究和公司产研体系架构设计。曾就职于华为、Amazon,拥有大型平台类软件产品架构体系研发经验。作为核心成员,吴小前主导实现KappaPlus架构的实时分布式数据分析架构,规划并设计了流批一体、湖仓一体的云原生数据智能平台,首次引入领先的MDS架构,打造中国版的低成本、高性能、易使用的实时湖仓平台。目前致力于研发搭建基础算力平台,打造Deepexi企业大模型及模型工具链应用。吴小前曾荣获“2021年度海纳奖——分布式数据库十大先锋人物”。
刘焕勇360人工智能研究院算法专家
个人介绍:360人工智能研究院算法专家、知识图谱方向负责人、360智脑项目组核心成员,“老刘说NLP”公众号作者,曾就职于中国科学院软件研究所。主要研究方向为大模型数据挖掘与自动化评估、领域知识/事件图谱的构建与落地应用,主持或参与研制全行业事理图谱、百科图谱、知识图谱平台、事件情报分析、右侧推荐、大模型研发等落地项目,申请发明专利十余项、论文数篇。近年来在OGB-Wikikg2、CCKS多模态实体对齐、可解释类案匹配等评测中获得多项冠亚军。致力于自然语言处理技术开源共享,在github开源项目60+,收获star数超2W+。
演讲题目:大模型幻觉的起因、评估及落地场景下基于知识图谱的缓解策略探索
1.什么是大模型幻觉,幻觉是好是坏?
2.为什么会出现幻觉,又如何评价幻觉?
3.幻觉在落地场景中如何用知识图谱加以缓解?外挂or受控生成or其他?
明希BentoML高级软件工程师
个人介绍:BentoML全栈工程师,Python玩家,开源爱好者。负责BentoML项目的开发。著名Python包管理器PDM作者。
演讲题目:使用OpenLLM构建和部署大模型应用
一、大模型应用部署的挑战
二、使用OpenLLM快速启动一个大模型的应用
a.通过OpenLLM调用大语言模型
b.通过OpenLLM启动一个HTTPserver
c.使用命令行进行模型推理
d.使用PythonClient与应用交互
e.OpenLLM与langchain的集成
f.模型推理性能的优化
三、使用BentoML工具构建并部署大模型应用
a.BentoML简介
b.构建一个bento
c.将Bento部署到bentocloud
1.如何使用常见的LLM快速启动一个应用
2.LLM应用性能优化的方法
3.BentoML框架的安装与使用方法
黄月红滴普科技语言模型研究员
个人介绍:滴普科技语言模型研究员,“CHAOS万有引力”公众号作者,发表过多篇国际会议和sci论文,五年深度模型开发经验。主要研究方向为大语言模型,机器视觉,有丰富的模型开发优化经验,同时在因果推断,推荐系统,知识图谱等领域也有一定兴趣和开发经验。
演讲题目:大语言模型优化:Fine-Tuning技术与方法实践
1.Fine-Tuning大语言模型的必要性分析
a.什么样的情况下需要fine-tuning大语言模型
b.fine-tuning大语言模型需要准备些什么
2.fine-tuning算法介绍
a.一般过程及原理
b.模型量化
c.qlora
d.Neftune
e.…
3.测试自己的大语言模型
a.各种测试平台,工具,方法,标准介绍
b.定义自己的测试指标和方式
1.了解如何fine-tuning大语言模型
2.了解fine-tuning的方法和策略
3.了解fine-tuning大语言模型评估方法
陈峰滴普科技SeniorResearchFellow
个人介绍:滴普科技高级研究员,《ClickHouse性能之巅》作者。数据智能领域资深架构师,曾主导OPPO智能缺陷识别、威视智能瞳孔检测、百丽丽影等多个数据智能项目技术架构的设计工作,有丰富的大模型落地经验。目前着眼于大模型在不同领域上的工程化落地。
演讲题目:领域模型生产指南
1.领域模型的难点
a.领域模型和通用大模型的异同点
b.领域模型的三大难点及其详细说明
2.领域模型的训练方法论
a.针对上诉难点的各种方法论
1.了解领域模型与通用模型的不同,
2.了解领域模型存在的几大难点
3.如何应对这三大难点的多种可行方法论
出品人:万里进百度主任架构师
金志鹏百度资深研发工程师
1.商业图文预训练大模型
2.多模内容表征如何赋能商业系统,包括排序系统、召回系统
3.多模内容理解与生成大一统
1.如何训练一个百亿的图文大模型?
2.多模态内容如何赋能商业系统?
3.排序模型的ID记忆性问题如何解决?
苏喻合肥综合性国家科学中心人工智能研究院副研究员
演讲题目:教育领域大模型的技术和应用
1.简述大语言模型在通用教育下有哪些应用场景
2.阐述目前智慧教育在技术上所面临的问题(有标签数据少、闭环周期长、需要融入领域知识)
4.1基于大语言模型的知识构建
(1)人机合的知识图谱构建技术:通过与大语言模型的结合,实现人机协作的方式,可以更高效、准确地构建领域内的知识图谱;
4.2基于大语言模型的仿真强化试题推荐技术
(1)基于大语言模型的学生学习行为仿真技术:通过大模型分析学生的学习行为,模拟其学习路径和趋势,从而预测学生在进行某个学习和做题后的知识水平情况;
(2)基于大语言模型的强化试题推荐技术:结合强化学习和大语言模型仿真,系统可以根据学生的学习历程和反馈,动态推荐适合其学习水平和需求的试题,帮助学生更加高效地学习和巩固知识;
(1)数字人AI录播课
(2)AI智慧编译器
听众将从本次演讲中获得对大语言模型在教音领域的深入了解,探索其如何解决智慧教育的技术挑战,以及实际应用中的具体案例,为教育者和技术从业者提供有价值的启示和激发创新思维的灵感。
严明阿里巴巴通义实验室高级算法专家
个人介绍:严明,中科院自动化所博士,阿里巴巴通义实验室NLP高级算法专家。主要研究方向为对话问答、预训练语言模型与多模态内容理解,目前为团队多模态大模型基础技术负责人。曾在SQuAD/GLUE/MSMARCO/VQA等10多个国际赛事中取得第一,并4次取得超越人类基准的结果,发表ICML/ACL/EMNLP/ICLR/CVPR/AAAI等40多篇国际顶级会议论文,目前负责通义星尘个性化大模型基础技术与X-PLUG开源体系构建。
1.大模型技术发展背景
2.通义星尘个性化大模型技术体系:个性化、多模态、Agent智能体等
3.通义星尘个性化大模型应用案例
1.个性化大模型与通用大模型的区别
2.通义星尘个性化大模型和通义mPLUG多模态大模型技术体系
3.通义星尘个性化大模型真实项目应用案例
出品人:孙伟快手数据平台部资深数据架构师
个人介绍:快手商业创新数据负责人&数据治理负责人,曾就职于百度、阿里巴巴,擅长数据体系、数据产品、数据化运营、数据管理等大数据解决方案的架构及建设。
林天权蚂蚁集团高级数据技术专家
个人介绍:林天权(花名:画龙),现任蚂蚁集团高级数据技术专家,有10多年大数据研发、架构升级和数据治理经验,14年开始加入蚂蚁,深度参与蚂蚁大数据的发展和升级演进,曾作为实时数据负责人主导蚂蚁双十一媒体实时大屏、蚂蚁全域实时采集链路和蚂蚁实时数据研发平台研发,以及PB级adhoc查询加速服务和大安全一键数据服务化平台研发与升级,现任蚂蚁安全大数据技术团队数据架构及治理负责人,推进技术创新,打造EB级AutoFinOps核心能力,升级蚂蚁新一代数据架构,用数据创造价值。
演讲题目:蚂蚁新一代数字智能化治理平台AutoFinOps实践与探索
1.数据治理的困难与挑战
2.数据治理的顶层设计和架构
3.数据治理自动化和智能化的最佳实践
4.思考总结与未来展望
1.了解蚂蚁数据治理的设计思路
2.深度解读蚂蚁“无感降本”技术如何高效实现
3.探讨数据治理领域未来趋势
冯赞锋快手大数据架构师
个人介绍:先后就职于百度、创新工厂-豌豆荚、快手三家公司,主要擅长大数据中台构建、数据治理,在搜索、爬虫、后端服务开发等方向也有一定积累,目前在快手主要负责数据治理架构设计和开发工作。
演讲题目:快手数据成本白盒化治理实践
1.1背景介绍
●数据治理介绍:快手数据治理整体介绍
1.2收益评估方法
○压缩率
○存储数据量
○资源消耗(CPU核*天)
○作业运行时长
○作业失败率
1.3引擎白盒化
●HBO
●JVM升级
●压缩算法替换
●计算过程拆解
1.4数仓白盒化
●基于SimilarSubExpression的公共模型构建和优化
●数仓自动化治理实践
1.5个人思考
●严谨:事前收益测算->事中灰逐步度验证,解决异常CASE->事后整体效果评估
●深入:对引擎、工具、数仓均有深入理解
●行动:躬身入局,模糊各个团队的边界
1.6未来规划
●压缩效率持续提升
●实时计算Flink白盒化
●数仓架构优化
1、深入到大数据存储计算引擎和数据仓库,对其进行白盒化拆解,在治理思路、治理经验等方面有不少可借鉴之处
2、讲述快手实践,如何成功降低千万级存储和计算成本
许璐平安产险数据智能大数据工程师
个人介绍:15年加入平安,目前负责平安产险大数据基础平台研发管理优化等工作。
演讲题目:数字化转型下的大数据平台治理
杨明皓数造科技高级大数据技术专家
个人介绍:英国谢菲尔德大学计算机硕士,海南数造科技高级技术专家。10年+金融行业实践经验,10年+大数据、知识图谱与自然语言研发经验。
演讲题目:DataOps加大模型促进数据工程创新
1.传统数据管理面临的挑战
2.DataOps与大模型结合激活数据工程潜力
3.数造科技DataOps与大模型的产品落地实践
1.DataOps的工作流程
2.大模型Text2SQL的能力
3.DataOps+大模型如何进一步提效数据工程
田奇铣阿里云DataWorks产品负责人
个人介绍:阿里云DataWorks产品负责人,打造全链路数据开发治理平台支撑阿里巴巴集团与阿里云上众多客户的数字化转型。
演讲题目:阿里云DataWorks湖仓融合数据治理与大模型应用探索
1.湖仓融合:现代企业数据架构演进
2.湖仓融合数据开发与治理应用实践
3.DataWorksCopilot结合大模型应用探索
胡金波重庆医科大学附属第一医院内分泌科副研究员,主治医师
个人介绍:胡金波,医学博士,主治医师、副研究员、博士生导师,获得重庆市杰出青年基金、重庆市高校巴渝学者。擅长内分泌性高血压、糖尿病、甲亢等内分泌疾病的诊治,主要研究领域为肾上腺疾病。曾留学美国哈佛大学。担任美国内分泌协会(ENDO)会员、重庆医师协会内分泌代谢科医师分会委员。主持国家级课题2项、省部级课题4项,获得省部级科研奖励2项。执笔撰写《中国肾上腺意外瘤多学科管理专家共识》,参编第2版人民卫生出版社《“5+3”医学整合课程教材》。在《AnnInternMed》、《JAmCollCardiol》、《Metabolism》等杂志发表论文35篇(中科院1区论文12篇)。
演讲题目:因果推断与医学研究
1)医药临床实验里的实验设计
2)医药学界对因果推断和实验设计的要求、解读和共识
1、如何从诊疗场景出发挑选合适的设计和推断方法
2、了解因果推断和实验设计在垂直领域的应用
3、医药学作为比互联网更早、更严谨使用随机实验和因果推断的垂直领域,给互联网公司带来的思考和启发
王世伟货拉拉增长数据科学负责人
演讲题目:货运双边市场实验的挑战和实践
1.初识货运双边市场
2.货运场景实验问题
3.货运实验技术方案
4.货运场景实验案例
1.同城货运如何交易的
2.如何缓解运力竞争带来的实验干扰
3.降本增效下如何衡量补贴策略效果
杨昆知乎实验平台技术负责人
演讲题目:知乎实验平台工程实践
演讲提纲:介绍知乎实验平台的架构体系演进,如何从0到1搭建实验平台,从不科学到科学置信的发展过程。
1.知乎实验平台的发展历程
2.踩过的坑和经验沉淀
3.科学实验平台的架构设计
1.实验平台分流模型的架构和设计
2.实验分析链路的构建
3.在实验的过程中哪些坑可以避免少走一些弯路
演讲题目:如何保证实验外部有效性(ExternalValidity)
1.问题背景-可能会造成实验期间观测到的效果和推全后不一致的原因
2.实验设计侧的解决方法
3.实验分析侧的解决方法
1.了解导致实验期间观测到的效果和推全后不一致的方法框架
2.了解双边市场实验设计和有溢出和抢夺效应时的实验设计及分析方法
3.了解其他消除内外部不一致的方法及应用场景
詹若涵香港科技大学助理教授
个人介绍:詹若涵是香港科技大学工业工程与决策分析系助理教授。她的研究开发了使用因果推理、统计和机器学习等工具来创新数据驱动决策的方法,尤其对平台运营和经济学问题感兴趣。此前,她获得了北京大学数学学士学位、斯坦福大学统计学硕士学位和计算与应用数学博士学位。
演讲题目:A/B测试中的实时监测策略与加速方法
1.在A/B实验中进行实时监控时,为什么传统的固定样本量测试方法不能有效控制第一类错误(Type-Ierror)?
2.我们推出了一种新的置信区间构建方法,适合于有重复观测的用户。此方法可以有效地在实时监控中控制第一类错误(Type-Ierror)。
3.如何确保实时监控实验的效能(power)?
4.如何基于实时观测来加速实验进程?
1.如何在实时监测A/B实验中有效控制第一类错误?
2.如何提高A/B实验的统计效能?
3.如何利用实时监测来加速A/B实验进程?
出品人:刘旭淘天集团内容技术负责人
个人介绍:刘旭,淘天集团内容技术负责人,负责大淘宝内容平台,以及多个内容导向型业务,例如淘宝信息流、淘宝逛逛等,核心能力包括音视频频编解码器、RTC、渲染、多模态内容理解、AIGC、创作者工具和媒体资产管理等。曾为达摩院机器人实验室总监,负责专注于配送服务机器人研发、产品规划、业务拓展等工作。曾为中国研发中心助理总经理,领导了多个产品和工程团队的产品规划、管理、系统设计验证和系统架构等工作。
俞一鹏淘天集团高级算法专家
演讲题目:生成式AI在淘宝内容的研究与应用
演讲提纲:演讲主要介绍AIGC技术在淘宝内容化业务中的算法研发和业务应用。具体包括:
1.UGC互动创新玩法
2.视频剪辑&生成技术
3.多模态大语言模型的落地挑战
1.AIGC技术在UGC互动的创新玩法尝试
2.视频剪辑&生成技术如何赋能商家和用户
3.多模态大语言模型的快速迭代和效果评估
陈宸OPPO研究院高级算法工程师
个人介绍:陈宸,本科毕业于上海交通大学,博士毕业于香港科技大学。主要研究方向包括视频编解码、图像处理、持续学习/鲁邦学习等机器学习基础问题、计算机视觉在细粒度识别上的应用、多模态预训练在AIGC方向的应用等。曾任腾讯高级研究员,负责腾讯全媒体内容安全识别体系的搭建。现任OPPO研究院高级算法工程师,负责多模态预训练在跨模态检索、理解和生成的端云场景应用研究。在大模型预训练、端侧轻量化以及下游应用都有长期业务实践经验。
演讲题目:多模态预训练模型在OPPO端云场景的落地实践
演讲提纲:主要围绕图文多模态预训练模型在检索、理解、生成等各个方向的云端两侧的技术优化和落地场景介绍。如何在低资源的情况下用最少的算力优化多模态大模型已经成功落地到移动终端。
1.图文检索云端两侧优化思路
2.文图生成大模型继续预训练优化思路
3.文图生成下游垂域优化思路(个性化生成、垂域微调、文字渲染等)
4.文图生成大模型端侧轻量化落地介绍
1.了解大模型在低资源下持续优化的算法实践经验;
2.了解大模型在移动终端的轻量化落地优化链路;
3.了解图文预训练模型在理解和生成方向的业务落地场景和实践经验。
付凡vivo人工智能部门算法总监
1、大模型演进&技术架构;
3、vivo在大模型产品落地技术;
1、预训练数据如果构建及预处理方案?
2、SFT如何提高模型效果?
3、大模型如何适配到产品应用?
冯可腾讯公共数据平台部内容智能应用组AI负责人
演讲题目:AIGC在游戏内容创作领域的应用
1.行业背景
游戏内容业务背景
研究现状与挑战
游戏智能创作效果
2.文本生成与游戏内容创作
在实际场景的应用效果
3.图片生成与游戏内容创作
4.视频生成与游戏内容创作
5.未来的机遇与挑战
1、了解游戏内容业务背景,以便更好地把握市场趋势和发展方向
2、了解游戏智能创作的研究现状与挑战
数智金融效能建设论坛
出品人:尹正中国信息通信研究院云计算与大数据研究所高级业务主管
张森森平安集团科技会数据管理高级经理
个人介绍:电子科技大学硕士毕业,曾服务于中通服,TeraData等知名公司。现就职于平安集团科技会安保中心数据管理部门,任技术平台组负责人(高级经理),曾负责引领集团数据中台的规划、建设,现负责集团数据技术管理运营工作以及集团数据管理平台的建设。
演讲题目:模型赋能下的数据安全合规管理
1.数据合规管理的架构
2.合规知识库的构建
3.借助大模型进行智能合规监测
4.实现全生命周期的数据合规监测-DCMM评估模型,评判数据能力成熟度-PIA评估个人信息收集利用合规性
5.构建数据合规化指标体系,实时监测风险
1.学习使用大模型构建智能化数据合规知识库
2.了解如何利用大模型进行数据合规能力评估
3.获取利用大模型提升数据合规水平的行业经验
左银康国信证券数据治理负责人
个人介绍:本科毕业于华中科技大学,先后在大型股份制商业银行、四大央企和国信证券从事数据治理工作。在商业银行总行开展数据治理,推动全行的数据标准制定、客户数据质量检核、元数据的管理和平台工具建设,在四大央企之一开展集团主数据建设,进行集团组织、员工、物料主数据的规划、实施和推广,目前在国信证券开展数据治理工作,负责公司数据治理组织、制度、流程、工具的规划、设计和实施落地。
演讲题目:基于需求驱动的数据治理场景化实践
1.数据治理缺乏业务配合,如何驱动业务和开发的积极性?
2.数据治理流于形式,如何嵌入日常的研发节点?
3.数据治理涉及领域众多,如何融合打通?
出品人:张靖bilibili高级技术总监
熊瑾bilibili数据产品经理
个人介绍:曾负责网易数帆的数据开发平台、阿里数据中台的用增/私域/集团标签等数据项目。目前在bilibili负责数据产品。
演讲题目:电商与内容型业务用增数据的基建异同
演讲提纲:在不同的业务类型、组织形态、发展阶段等要素下,用增数据如何建设好。
听众收益:用增数据建设在诸多不同要素下的数据实践差异:
1.业务类型:电商业务v.s.内容社区业务
2.组织形态:自上而下型v.s.自下而上型
3.发展阶段:成熟期v.s.生长期
董沅阿里巴巴-瓴羊数字营销产品经理
个人介绍:主攻大数据AI方向,深耕行业应用产品多年,现负责阿里巴巴线下营销产品设计研发。
1、线下营销盲点分析
1、如何实现线下精准营销?
3、如何沉淀户外营销的资产?
焦文健京东大数据产品总监
个人介绍:京东大数据产品总监,中国人民大学MBA,十年以上大数据从业经验,具有数据中台化、数据业务化、数据智能化的落地实践经验。