数据集(二)10个领域70+数据集分享,赶紧收藏!

学习数据分析需要实操,但找数据集难。小编整理了商业、消费、住房、体育、植物、天文、推荐系统、预测、文化娱乐及其他等10领域70+数据集,包含在线教育投融、中国工商企业注册、互联网公司数据、出行产品销量预测等,适合各类练习,速收藏。

学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了10个领域70+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!

1.在线教育投融数据集(2015-2020年)(513.8KB)

2.中国工商企业注册信息数据集(559.4MB)

3.8W家中国互联网公司数据(11.3MB)

4.2019年全球七百多万个公司的数据(275.1MB)

1.出行产品未来14个月销量预测数据集(61.2MB)

2.口红数据集(1006.6KB)

3.黑五购物数据集(23.8MB)

4.去哪儿网—旅游产品机酒数据(1.5MB)

5.全球米其林餐厅信息(100KB+)

6.适合顾客尺码推荐的服装适合数据集(150MB)

7.淘宝App用户行为(507.3MB)

8.淘宝用户行为数据集(164.6MB)

9.废旧汽车价格预测数据集(611.6KB)

10.天猫双十一女性美妆的数据集(3.3MB)

11.淘宝云主题点击数据集(1.6GB)

13.9万条上海餐饮数据(6.5MB)

14.天猫订单成交【真实】数据(1.8MB)

1.链家二手房数据集(5.1MB)

2.携程房型产品用户行为数据集(506.1MB)

3.房价预测(103.3KB)

4.阿姆斯特丹airbnb数据集(400MB+)

5.纽约Airbnb开放数据(6.8MB)

6.房价预测(103.3KB)

1.NBA数据集(62.3+MB)

2.欧洲足球联赛数据集(172.8MB)

3.2015-2018MLB棒球常规赛数据集(322.7MB)

4.120年奥运历史数据集:运动员和成绩(39.6MB)

5.科比生涯数据集(5.8MB)

6.NFL大数据可视化(100.8KB)

1.蘑菇分类数据集(UCIMachineLearning)(365.2KB)

2.iris鸢尾花数据集(4.1KB)

3.土壤湿度的高光谱基准数据集(1.6MB)

4.小麦种子数据集(9.1KB)

5.100种植物种类数据集(35.1MB)

1.不明飞行物世纪报告(14.6MB)

1.资讯内容用户行为数据集(153.3MB)

2.BookCrossing推荐系统数据(24.9MB)

3.Jester推荐系统数据(4MB)

1.人力资源分析数据集(121.5KB)

2.申请大学的成功率预测数据集(12.6KB)

3.用户点击预测数据集(516.8MB)

4.NetflixPrice竞赛数据集(665.7MB)

1.170K+首Spotify歌曲数据集(30+MB)

2.TMDB5000部电影数据集(40MB+)

3.Disney华特迪士尼电影数据集(181.2KB)

1.2017年-2018年关于申根签证的数据集

2.垃圾分类数据(49.3KB)

3.二战空袭数据集(27.2MB)

4.拉勾网上海数据分析师职位数据(497.4KB)

5.濒危语言统计(736.7KB)

6.CNNVD中国信息安全漏洞数据库

7.个人睡眠数据(66.1KB)

8.2019年世界幸福报告(6.7KB)

9.鲍鱼数据集(187.5KB)

10.鱼类毒性数据集(30.5KB)

11.人口普查收入数据集(UCI)(3.4MB)

12.足球运动员数据集(3.7MB)

13.全球各国人口数据数据集(1.9MB)

【1】数据分析师如何构建数据指标体系?理解以下四个模型就够了!

【2】数据分析师如何正确的提建议?

推荐阅读

学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了7个领域70+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!01、交通类数…

2,772

学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了人工智能领域100+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!01、N…

3,581

【好货赶紧收藏啊!!!】—【库存】大揭秘

【库存】产品全景大揭秘,你不得不看好贴!密码:kd2013cloud:victory:,为什么下不了呢,,为什么下不了:(,请问下楼主密码为什么是错的…

THE END
1.推荐系统常用数据集delicious2k推荐系统常用数据集 首先需要说明一下推荐系统数据中的几个类别: Item: 即我们要推荐的东西,如产品、电影、网页或者一条信息片段 User:对item进行评分以及接受推荐系统推荐的项目的人 Rating:用户对item的偏好的表达。评分可以是二分类的(如喜欢和不喜欢),也可以是整数(如1到5星)或连续(某个间隔的任何值)。 https://blog.csdn.net/qq_28966711/article/details/89608390
2.推荐系统常用数据集1. Criteo 数据集 criteo数据集用于广告点击率预估任务(标签:0/1);其中包含13个dense特征和26个sparse特征; 数据格式如下:第一列为label, 之后分别是13个dense特征(integer feature),26个sparse特征(categorical feature);每列之间使用tab进行分隔。 <integer feature1><integer feature13><categorical feature1https://www.jianshu.com/p/5c88f4bd7c71
3.推荐系统常见数据集liujy1推荐系统常见数据集 Douban:http://socialcomputing.asu.edu/datasets/Douban这是一个匿名的豆瓣数据集,包含129,490个独立用户和58,541个独立电影条目。 Epinions:http://www.trustlet.org/epinions.htmlEpinions是一个人们可以评论产品的网站。 Flixster:http://socialcomputing.asu.edu/datasets/FlixsterFlixster是一https://www.cnblogs.com/laojifuli/p/12126302.html
4.知识图谱的推荐系统数据集wx5cac1bacddda7的技术博客知识图谱在推荐系统中可以用于丰富用户和物品的信息,从而提高推荐的精度和个性化程度。以下是一些包含知识图谱信息的推荐系统数据集的示例: Freebase数据集:Freebase是一个开放的知识图谱,包含了大量实体之间的关系信息。您可以使用Freebase数据来构建知识图谱推荐系统的数据集。 https://blog.51cto.com/u_14282855/8648588
5.数据挖掘数据集iris还有什么帆软数字化转型知识库在数据挖掘中,除了著名的Iris数据集外,还有许多其他常用的数据集可以用于各种分析和机器学习任务。这些数据集包括:Titanic数据集、MNIST数据集、CIFAR-10数据集、Wine数据集、Adult数据集。Titanic数据集是一组关于1912年泰坦尼克号沉船事故的乘客数据,常用于分类和生存分析。Titanic数据集不仅包含乘客是否幸存的信息,还包括https://www.fanruan.com/blog/article/581042/
6.机器学习快速入门数据集划分(二)这种数据集划分方法叫"留出法"。留出法一般采用70%的数据用于训练,剩下30%的数据用于测试模型的"性能"(准确率等等指标),该方法也是最常用的方式之一。 2.2 k折交叉验证法 有同学可能会想到,如果得到的数据集巨大,是否可以取其中的一部分当做数据集,然后对该子数据集进行划分训练集与测试集? 当然可以!假设数据集https://www.bilibili.com/opus/1012874127334178854
7.面向推荐系统的图卷积网络?5 总结与展望 本文解决的问题是如何为推荐系统设计更合理的图卷积网络算法.首先根据信息利用方式的不同,将现有 基于图卷积网络的推荐算法分类为异质顶点交互算法和同质顶点交互算法,而两类方法都忽略了两者间的互 助.正是为了两者能够互惠互利,本文提出了一种联合利用异质和同质交互图的图卷积网络算法.真实数据集上 https://jos.org.cn/jos/ch/reader/create_pdf.aspx?file_no=5928&journal_id=jos