数据集(二)10个领域70+数据集分享,赶紧收藏!

学习数据分析需要实操,但找数据集难。小编整理了商业、消费、住房、体育、植物、天文、推荐系统、预测、文化娱乐及其他等10领域70+数据集,包含在线教育投融、中国工商企业注册、互联网公司数据、出行产品销量预测等,适合各类练习,速收藏。

学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了10个领域70+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!

1.在线教育投融数据集(2015-2020年)(513.8KB)

2.中国工商企业注册信息数据集(559.4MB)

3.8W家中国互联网公司数据(11.3MB)

4.2019年全球七百多万个公司的数据(275.1MB)

1.出行产品未来14个月销量预测数据集(61.2MB)

2.口红数据集(1006.6KB)

3.黑五购物数据集(23.8MB)

4.去哪儿网—旅游产品机酒数据(1.5MB)

5.全球米其林餐厅信息(100KB+)

6.适合顾客尺码推荐的服装适合数据集(150MB)

7.淘宝App用户行为(507.3MB)

8.淘宝用户行为数据集(164.6MB)

9.废旧汽车价格预测数据集(611.6KB)

10.天猫双十一女性美妆的数据集(3.3MB)

11.淘宝云主题点击数据集(1.6GB)

13.9万条上海餐饮数据(6.5MB)

14.天猫订单成交【真实】数据(1.8MB)

1.链家二手房数据集(5.1MB)

2.携程房型产品用户行为数据集(506.1MB)

3.房价预测(103.3KB)

4.阿姆斯特丹airbnb数据集(400MB+)

5.纽约Airbnb开放数据(6.8MB)

6.房价预测(103.3KB)

1.NBA数据集(62.3+MB)

2.欧洲足球联赛数据集(172.8MB)

3.2015-2018MLB棒球常规赛数据集(322.7MB)

4.120年奥运历史数据集:运动员和成绩(39.6MB)

5.科比生涯数据集(5.8MB)

6.NFL大数据可视化(100.8KB)

1.蘑菇分类数据集(UCIMachineLearning)(365.2KB)

2.iris鸢尾花数据集(4.1KB)

3.土壤湿度的高光谱基准数据集(1.6MB)

4.小麦种子数据集(9.1KB)

5.100种植物种类数据集(35.1MB)

1.不明飞行物世纪报告(14.6MB)

1.资讯内容用户行为数据集(153.3MB)

2.BookCrossing推荐系统数据(24.9MB)

3.Jester推荐系统数据(4MB)

1.人力资源分析数据集(121.5KB)

2.申请大学的成功率预测数据集(12.6KB)

3.用户点击预测数据集(516.8MB)

4.NetflixPrice竞赛数据集(665.7MB)

1.170K+首Spotify歌曲数据集(30+MB)

2.TMDB5000部电影数据集(40MB+)

3.Disney华特迪士尼电影数据集(181.2KB)

1.2017年-2018年关于申根签证的数据集

2.垃圾分类数据(49.3KB)

3.二战空袭数据集(27.2MB)

4.拉勾网上海数据分析师职位数据(497.4KB)

5.濒危语言统计(736.7KB)

6.CNNVD中国信息安全漏洞数据库

7.个人睡眠数据(66.1KB)

8.2019年世界幸福报告(6.7KB)

9.鲍鱼数据集(187.5KB)

10.鱼类毒性数据集(30.5KB)

11.人口普查收入数据集(UCI)(3.4MB)

12.足球运动员数据集(3.7MB)

13.全球各国人口数据数据集(1.9MB)

【1】数据分析师如何构建数据指标体系?理解以下四个模型就够了!

【2】数据分析师如何正确的提建议?

推荐阅读

学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了7个领域70+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!01、交通类数…

2,772

学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了人工智能领域100+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!01、N…

3,581

【好货赶紧收藏啊!!!】—【库存】大揭秘

【库存】产品全景大揭秘,你不得不看好贴!密码:kd2013cloud:victory:,为什么下不了呢,,为什么下不了:(,请问下楼主密码为什么是错的…

THE END
1.(13301)服装推荐系统:数据集处理——初步分析推荐系统的数据集文章浏览阅读1.2k次,点赞15次,收藏14次。在"notebooks" 目录中保存了和数据处理相关的Notebook文件:data_cleaning.ipynb、eda_feature_eng.ipynb和initial_analysis.ipynb。_推荐系统的数据集https://blog.csdn.net/asd343442/article/details/137874137
2.推荐系统之基于内容的推荐算法:BM25:数据集构建与管理.docx推荐系统之基于内容的推荐算法:BM25:数据集构建与管理.docx 19页内容提供方:找工业软件教程找老陈 大小:33.13 KB 字数:约1.75万字 发布时间:2024-09-05发布于辽宁 浏览人气:13 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)https://max.book118.com/html/2024/0904/8073030126006123.shtm
3.推荐系统常用数据集1. Criteo 数据集 criteo数据集用于广告点击率预估任务(标签:0/1);其中包含13个dense特征和26个sparse特征; 数据格式如下:第一列为label, 之后分别是13个dense特征(integer feature),26个sparse特征(categorical feature);每列之间使用tab进行分隔。 <integer feature1><integer feature13><categorical feature1https://www.jianshu.com/p/5c88f4bd7c71
4.知识图谱的推荐系统数据集wx5cac1bacddda7的技术博客知识图谱在推荐系统中可以用于丰富用户和物品的信息,从而提高推荐的精度和个性化程度。以下是一些包含知识图谱信息的推荐系统数据集的示例: Freebase数据集:Freebase是一个开放的知识图谱,包含了大量实体之间的关系信息。您可以使用Freebase数据来构建知识图谱推荐系统的数据集。 https://blog.51cto.com/u_14282855/8648588
5.伯乐,一个统一全面高效的推荐系统代码库我们实现了百余种常用的推荐算法,并提供了43个推荐数据集的格式化副本。 大规模的标准评测 我们支持一系列被广泛认可的评估方式来测试和比较不同的推荐算法。 RecBole 是一个基于 PyTorch 实现的,面向研究者的,易于开发与复现的,统一、全面、高效的推荐系统代码库,它可以通过 pip, conda 和源文件三种途径安装,使https://recbole.io/cn/
6.融合用户属性信息的冷启动推荐算法AET在实验数据集1上,实验结果如表1。 其中,pearson-knn是采用pearson相关系数作为相似性度量,基于用户(50个邻居)的推荐评分预测方法;MF是采用simon funk提出的矩阵分解的方法(10个潜在因子);FP(fused preference)是本文提出的方法。可见,在一般数据集上,FP和MF性能接近,优于基于用户的协同过滤的方法。 http://www.chinaaet.com/article/3000073409