Antkillerfarm Hacking V7.0

知名数据集(二)

2019-06-21

知名数据集

NLP(续)

https://mp.weixin.qq.com/s/Ud2pwlNSIEb3HncCrniMxA

最全中华古诗词数据库,收录30多万诗词

https://mp.weixin.qq.com/s/FdQ7IF4N3BhiqjZ32ZMirg

中文细粒度命名实体识别数据集来了

https://mp.weixin.qq.com/s/jkM0iYFMjIXdfFQVxw86Bg

KdConv:多领域知识驱动的中文多轮对话数据集

CV

http://www.cvpapers.com/datasets.html

常见的cvpr研究的数据库下载链接

https://mp.weixin.qq.com/s/SKZhcd3QpoVMubTkD14iWw

Fashion-MNIST:替代MNIST手写数字集的图像数据集

https://mp.weixin.qq.com/s/77VZ8HPQXWAPvmpZA97kmg

CV预训练模型全集

https://niessner.github.io/Matterport/

全球最大的3D数据集公开了!标记好的10800张全景图

https://mp.weixin.qq.com/s/FciCPM8CjOwGKlltJsH0XA

超全的3D视觉数据集汇总

https://mp.weixin.qq.com/s/q2lsD4MSqQG-LqRmVjEHeg

图像配对数据集TTL:展现人类和机器判断图像相似性的差异

https://mp.weixin.qq.com/s/Y__z-0nxAZNuZsZefCm4IA

纽约大学联合谷歌大脑提出“COG”数据集,可提高系统的“视觉推理”能力

https://mp.weixin.qq.com/s/0D8OQ6hF_70mNtadewyGVw

全球最大的第一视角视频数据集开源,取自真实生活,还能提升厨艺

https://mp.weixin.qq.com/s/NXI9Bp4xxbZCQqAddK1HgA

Google开放最大目标检测数据集,还要为它举办AI挑战赛

https://mp.weixin.qq.com/s/DsBoGT2Pl4tRwHX8REOqnw

MURA:斯坦福ML团队开放的大型放射影像数据集与挑战赛

https://mp.weixin.qq.com/s/_wQoiC6ogcLWSEUFUGHd5g

Facebook,MIT等发布大规模卫星图像理解数据挑战赛DeepGlobe 2018

https://mp.weixin.qq.com/s/WPESySGMv_ehSt6oNUkVGg

视频语义显著实例分割数据集SESIV

https://mp.weixin.qq.com/s/fR8-zODLNp24nlR5dJ85Nw

3万患者11万图像14类病理:NIH公开大规模胸部X光数据集

https://mp.weixin.qq.com/s/d-fIQwMxHXTJvFWQUKHAvw

我用5000万组数据分析了“猜画小歌”

https://mp.weixin.qq.com/s/jOjiAAK1byUx8ic011f33w

2200万室内场景数据集,包含语义、全景、灯光等十余种效果

https://mp.weixin.qq.com/s/aw5o-1Bwc4hQUatehFFx2A

南京大学发布WebCaricature漫画人脸识别数据集

https://mp.weixin.qq.com/s/deJ6dChES_WhYH8T05ruag

腾讯AI实验室宣布开源多标签图像数据集ML-Images

https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650750713&idx=5&sn=678eef1122d35c048a5fca8f22fa12c9

CIFAR-10+ImageNet=?CINIC-10!

https://mp.weixin.qq.com/s/Kxnvv1i0nvkg0vUDBlx6MA

向机器学习偏见开战:谷歌展示全球涂鸦数据集分析结果

https://mp.weixin.qq.com/s/vTnc55KAiGaFfktHPZctbw

捡漏!用谷歌图片搜索自制深度学习数据集

https://mp.weixin.qq.com/s/-NQa2VeuskDx5XN9WMCmPQ

腾讯开源业内最大多标签图像数据集,附ResNet-101模型

https://mp.weixin.qq.com/s/8nPfU72WocrDxToG6v5tIA

计算摄影学数据集汇总(一)

https://mp.weixin.qq.com/s/0b0g-IwJVsiKKTY_TLRmZA

1460万个目标检测边界框:谷歌开源Open Images V4数据集

https://blog.csdn.net/fuwenyan/article/details/79224753

服装分类检索识别数据集

https://blog.csdn.net/fuwenyan/article/details/78203803

DeepFashion: 服装公开数据集概述

https://mp.weixin.qq.com/s/YzuMtFUE3aw7rRplVzAKmQ

短视频识别,都有那些行业标准?

https://mp.weixin.qq.com/s/iR7SPg_3AStJh5wzkEpoAg

这个“多模态视频人物数据集”里,藏了杨幂、吴亦凡和鹿晗

https://mp.weixin.qq.com/s/DhuZJae-Dp4MnCIfc3SAgw

阿里如何将“高峰前扩容、高峰后缩容”的梦想照进现实?

https://mp.weixin.qq.com/s/NLumRBw5Zqqf08fBJLeTsw

新任务&数据集:视觉常识推理(VCR)

https://mp.weixin.qq.com/s/uqFy-1_JM9P2WKU5YOmwmA

一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……

https://mp.weixin.qq.com/s/QEq8fHY2HCOuCXUWXwOpyA

情人节:一本正经地为单身狗推荐这个158万张图像的鉴黄数据集

https://zhuanlan.zhihu.com/p/55627416

旷视RPC大型商品数据集发布!

https://mp.weixin.qq.com/s/DtVa_tL5OfC2i-hbFZKY5Q

视觉推理任务中的ImageNet:斯坦福GQA数据集重磅发布

https://mp.weixin.qq.com/s/byEa0rnfBU3WP0KzOMZBVw

你也能用英伟达GAN造脸了:官方实现有了,高清数据集也开源了

https://mp.weixin.qq.com/s/OU3onjVeOnqo_ORIJtQdMQ

DeepFashion2数据集:87.3万对买家秀-卖家秀图像+海量标注

https://mp.weixin.qq.com/s/l5wXZOiRj53ufckiRx0hIw

从图像中检测和识别表格,北航&微软提出新型数据集TableBank

https://mp.weixin.qq.com/s/ze8SWIrUAPnOUsslxpv2Rg

如何从900万张图片中对600类照片进行分类,附代码

https://zhuanlan.zhihu.com/p/53151892

航拍/无人机视频图像数据集

https://mp.weixin.qq.com/s/hH3Px_KGegJbGbBvfqrXYA

谷歌开放史上最大分割掩码数据集

https://github.com/lartpang/awesome-segmentation-saliency-dataset

图像分割/显著性检测数据集列表

https://mp.weixin.qq.com/s/q0GrF3tRBKnio23OzmIF6w

找不到合适的数据?这里有281个计算机视觉数据集任你选

https://mp.weixin.qq.com/s/HhamuAkWcoHy1cw9qZo_GA

港中文开源视频动作分析库MMAction,目标检测库算法大更新

https://mp.weixin.qq.com/s/xnhPvgJxsXvJOIABWVLmRg

颜值,自拍,美学三大任务简介和数据集下载

https://zhuanlan.zhihu.com/p/71823334

百万级别二次元角色识别数据集

https://mp.weixin.qq.com/s/bOpKXshitpQ1YKE53WUPEw

UCSB等机构提出首个大规模视频语言数据集

https://mp.weixin.qq.com/s/3S9TJo1LJ_A5Zvr2gEl9Nw

深度学习中图像语义分割基准数据集详解

https://mp.weixin.qq.com/s/W9KoEgbEkSNkxQIa92sRMg

视频分类模型和数据集板块干货集锦

https://mp.weixin.qq.com/s/xZVC3-OBVo5P7WW-Y9Pe8A

LVIS:大规模细粒度词汇级标记数据集 ,出自FAIR ,连披萨里的菠萝粒都能完整标注

https://mp.weixin.qq.com/s/fgaHG5FmJ8du2SCHm0wZTg

开源新数据集,助力Deepfake检测研究

https://mp.weixin.qq.com/s/WvkIQ85CpCR7yhHiPbX6HA

Objects365:大且高质量的数据集用于目标检测

https://mp.weixin.qq.com/s/yj-8sTl_ZT17IvpqPs89IA

改变多目标跟踪领域!CMU等推出大规模多类别MOT数据集TAO

https://mp.weixin.qq.com/s/2yzD3EYIQpsTjJcwrD1_PA

11个经典遥感数据集

人脸/行为

http://blog.csdn.net/wangkr111/article/details/44514097

肤色检测&人脸检测数据集等链接大集合

https://mp.weixin.qq.com/s/aPlNov77l-3hBRePbIEOrg

一文道尽“人脸数据集”

https://mp.weixin.qq.com/s/VX5IIzDwPXCxCxvocAji0g

最全1.5万字长文解读7大方向人脸数据集v2.0版

https://mp.weixin.qq.com/s/BCgVMYe011O-Jse4ZFBbxg

谷歌发布人类动作识别数据集AVA,精确标注多人动作

https://mp.weixin.qq.com/s/vp–aYbPKi8yDSiS5MPMLA

MIT与Facebook提出SLAC:用于动作分类和定位的稀疏标记数据集

http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/

WIDER FACE: A Face Detection Benchmark

http://mmlab.ie.cuhk.edu.hk/archive/CNN_FacePoint.htm

人脸关键点检测的训练数据集

https://zhuanlan.zhihu.com/p/39737327

想训练动作识别模型?这里有六个数据源供你参考

https://mp.weixin.qq.com/s/3QD3KI4IwBQlnPPDpPBb2A

更大的行人重识别测试集 Market-1501+500k

https://mp.weixin.qq.com/s/bYaAYkTj_0OxpDcWsToBWw

业内最大规模!美图联合清华推出教程类行为数据集COIN

https://mp.weixin.qq.com/s/FFxWlWx-Cri1Qevd-X43kg

几个人像分割数据集简介和下载

https://mp.weixin.qq.com/s/XsRIuxpqK2UlgLhM7Vxg6g

动作识别数据集简介

https://mp.weixin.qq.com/s/T0EHQlfac1ni9a3Z71-kmg

爱奇艺人物识别数据集已上线

https://mp.weixin.qq.com/s/oytk2jEljYn8nL8a4wycLg

这几年人脸都有哪些有意思的数据集?

https://zhuanlan.zhihu.com/p/130720627

FineGym:面向细粒度动作分析的层级化高质量数据集

https://mp.weixin.qq.com/s/e4XcUJ7goqygu9LlBy8yOA

全网唯一秃头数据集:20万张人像,网罗各类秃头

推荐系统

http://www.zanmel.com/2015/12/14/10-great-datasets-on-movies/

最知名的电影数据集。

https://mp.weixin.qq.com/s/hrI0ILAs4Nko_JkqegaANA

推荐系统9个必备数据集

https://mp.weixin.qq.com/s/DxVhQx4b9GP6IoXOpGESDQ

推荐系统的常用数据集

https://mp.weixin.qq.com/s/U96j-8_8yo_KGEu9ufWBGg

亚马逊Kindle电子书和纸质图书销售排行数据

https://zhuanlan.zhihu.com/p/40785841

6个推荐系统开放公共数据集整理分享

https://mp.weixin.qq.com/s/dCN0N1EpQVxXyBpUyG-3Hg

推荐系统领域常见公共数据集

无人驾驶

https://mp.weixin.qq.com/s/YlC4fbn8O15JdNsVTnBVOw

无人驾驶数据集汇总

http://www.cvlibs.net/datasets/kitti/

KITTI Vision Benchmark Suite:一个自动驾驶方面的数据库。包括GPS、雷达、摄像头等数据。

https://github.com/MarvinTeichmann/KittiSeg

一个KITTI数据集上的道路图像语义分割模型。

https://mp.weixin.qq.com/s/y_Q1umHaC0NEuj2TlKoKZQ

百度Apollo推出大规模自动驾驶数据集,将于CVPR发起挑战赛

https://mp.weixin.qq.com/s/nDX4oSV-_zs5TMl3Q8eP3A

伯克利发布BDD100K:目前最大规模开放驾驶视频数据集

https://mp.weixin.qq.com/s/gKZt903-hrlcEK-O5k-pTw

本田公布104小时驾驶行为数据集:时间不长但胜在全面

https://mp.weixin.qq.com/s/9k2aorOp_zc10JKf9F9Evw

上海交大和厦门大学联合发布大规模驾驶策略学习数据集DBNet

https://mp.weixin.qq.com/s/4A68qHXEA7VHe8RrKv7Wbg

自动驾驶都有什么测试基准?

https://mp.weixin.qq.com/s/Mt40v0fy3_eq6tkz6a8ndQ

英伟达推出首个跨摄像头汽车跟踪数据集

https://mp.weixin.qq.com/s/7q8T6ZArobucty6Rlv3JRw

神秘的Waymo一反常态,CVPR现场发布大型自动驾驶数据集

https://mp.weixin.qq.com/s/L6r59FOy-hhygnMsfpa2gg

Apollo开放全长380km点云数据集,助推厘米级精度定位实现

https://mp.weixin.qq.com/s/89a4gd3942BGTemPz0oFow

Lyft公开自动驾驶数据集,包含55000个人工标注3D注释帧

https://mp.weixin.qq.com/s/fDSC_e3JwVw3i2VLlBIkEQ

Waymo公开全球最大规模自动驾驶传感器数据集:1200万3D标签,1000段驾驶片段

https://mp.weixin.qq.com/s/S8V9-9L86ob1Fnt6NMuJgA

Mapillary发布世界最大交通标志数据集,用于自动驾驶研究

https://mp.weixin.qq.com/s/hXtkTECVfsBltAtYWu4XYg

最大识车数据集出炉:6.4万张,车型参数完整标注,交通安防二手车都能用

https://zhuanlan.zhihu.com/p/110987552

新数据集:从行人重识别到无人机目标定位

https://mp.weixin.qq.com/s/G8tImide_U33shaybprvcw

天津大学推出大型无人机航拍车辆数据集DroneVehicle

Fork me on GitHub