学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了人工智能领域100+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!
1.2016-2019新闻联播语料库(11.3MB)
2.中文谣言语料库(32.6MB)
3.中国对联数据集(28.2MB)
4.1998人民日报标注语料库(PFR)(10.2MB)
7.中文新闻数据集(70.3MB)
8.耶鲁文本转SQL语句挑战数据集(95.1MB)
9.新加坡国立大学SMS语料库(23.4MB)
10.中文经典典籍语料
11.非正式汉语数据集(214.5MB)
12.维基百科中文语料库(518.7MB)
13.频率最高的9933个最常用汉字数据集(1.0MB)
14.聊天语料库数据集(210.7MB)
15.短文本分类数据集(13.1MB)
16.成语阅读理解数据集(195.8MB)
17.论文自动评分数据集(78.8MB)
18.翻译语料(595.9MB)
19.中文科学文献摘要数据集(92.9MB)
20.维基百科英文语料库(89.0MB)
21.LordoftheRings指环王数据(223.9KB)
22.中文机器阅读理解的跨度提取数据集(CMRC2018)
23.36氪新闻数据集(42.5MB)
25.1万条互联网专栏资讯数据集(75.7MB)
26.2万条中文金融新闻数据集(66.6MB)
27.中文图书分类数据集(49.8MB)
28.英文歌词数据集(69.1MB)
1.金融行业问答数据集(245.5MB)
2.社区问答数据集(1.7GB)
3.中文医学问答数据集(85MB)
1.斯坦福情绪树库:带有情感注释的标准情绪数据集(6.1MB)
2.关于美国的航空公司的推特的情绪分析数据集(2.6MB)
3.中文对话情绪语料(1.1MB)
4.多域情感数据集(51.2MB)
5.sentiment140情感分析数据集(72.6KB)
1.6000条周杰伦微博超话数据!(1.1MB)
2.《中餐厅3》19W弹幕数据(12.8MB)
3.bilibili流行动漫影评数据(2.3MB)
9.6000条周杰伦微博超话数据(1.1MB)
1.用于命名实体识别的带注释语料库(26.4MB)
2.使用LatticeLSTM的中文NER数据(191.5KB)
3.医疗命名实体识别数据集(5.1MB)
4.中文实体关系抽取数据集(8.1MB)
5.金融信息负面及主体判定比赛数据集(17MB)
1.Pronto共享单车数据集(70.8MB)
1.Fashion-MNIST图像数据集(200.4MB)
2.CIFAR100数据集(161.3MB)
3.车辆数据集(车辆识别与分类)(62.5MB)
4.垃圾分类数据集
5.另一个垃圾分类数据集(40.9MB)
6.CIFAR10数据集(148MB)
7.GTSRB-德国交通标志识别图像数据(253.3MB)
8.手势识别数据库(1.1GB)
9.情绪的面部表情(170MB+)
10.枪支目标检测(2.4MB)
11.人脸图像数据(294.1MB)
12.RMFD口罩遮挡人脸数据集(610.3MB)
13.中国交警手势数据集(1.8GB)
14.场景分类数据集(105.9MB)
15.87种宝石图片数据(50.9MB)
16.验证码数据集(13.5MB)
17.硬币图像数据集(326.7MB)
18.LabelMe图像语义分割数据集(102.6MB)
19.车牌识别数据集(62.8MB)
20.Biwi头姿势数据库(449.7MB)
动物
21.Butterfly-200细粒度图像分类数据集(828MB)
22.宠物图像数据集(783.5MB)
23.狗狗种类图像数据集(919.5MB)
24.黑猩猩图片数据集(604.4MB)
植物:
25.水稻叶子疾病图片集(36.7MB)
26.植物幼苗图片数据集
27.花卉识别数据集(224.9MB)
28.花卉图像分类
29.可食用野外植物数据集
30.叶片计数图像数据集(882.3MB)
气象:
31.飓风损害的卫星图像数据集(63MB)
32.从卫星图像理解云层数据集(42MB)
字符识别:
33.TibetanMNIST藏文手写数字数据集(53.2MB)
34.MNIST手写识别数据集(9.5MB)
35.Chars74K字符识别数据集(188.3MB)
36.信用卡卡面图像及标注数据(42.9MB)
37.手写数学表达式识别(29MB)
38.图片与单词匹配数据集(31.1MB)
39.密集不规则文本行数据集(353MB)
40.视觉文字识别数据集
41.HASY手写符号图片数据集(127.2MB)
42.麻将图片数据集(7.5MB)
医疗:
43.犬球虫病寄生虫图片集(18.1MB)
44.头部CT图像数据(24.4MB)
45.肺部CT图像数据(529.0MB)
46.心血管疾病预测(2.7MB)
47.深圳医院胸片检查掩膜图片数据集(19.8MB)
48.肺部CT图像数据(529MB)
49.结核病图像数据集(456.8MB)
行人识别:
50.行人检测数据集ETHZ(146MB)
51.行人重识别数据集Market-1501(145.7MB)
52.行人重识别数据集RAiD(140.1MB)
53.行人重识别数据集prid_2011(1015.3MB)
54.汽车后视摄像头视角行人数据集(799.7MB)
1.Mozilla语音数据集-中文(358.2MB)
2.2000个英语读数字的录音(8.9MB)
【1】数据分析师如何构建数据指标体系?理解以下四个模型就够了!
【2】数据分析师如何正确的提建议?
推荐阅读
学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了7个领域70+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!01、交通类数…
2,505
学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了10个领域70+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!01、商业类…
1,696
【好货赶紧收藏啊!!!】—【库存】大揭秘
【库存】产品全景大揭秘,你不得不看好贴!密码:kd2013cloud:victory:,为什么下不了呢,,为什么下不了:(,请问下楼主密码为什么是错的…