CASIAWebFace

CASIA-WebFace是一款免费开源的用于人脸识别的数据集,它是从IMDb网站上进行数据爬取,IMDb网站上包含了许多名人的照片以及姓名,CASIA-WebFace作者编写了一个爬虫软件,取爬取IMDb上的照片以及名称并保存下来,所以CASIA-WebFace也可以理解为包含了名人的数据集。CASIA-WebFace的优势在于具有非常多人脸特征,并且数据集里不会有重复特征,它的爬虫软件会使用人名作为哈希值来编写布隆过滤器,来过滤掉哪些重复数据集,并且它的数据集还在迭代更新,截至目前2021.12.30,共有一万五千个名人数据集和四十九万张照片。

Last updated