人群计数:SingleImageCrowdCountingviaMultiColumnConvolutionalNeuralNetworkyumoye

公共场合中通过摄像机实现人数计数具有重要的研究价值。比如:候车大厅中人群计数的结果,可优化公共交通的调度;某区域中人数的急剧变化既可能会导致意外事件的发生,又可能是意外事件发生的结果。公共场合中采用摄像机实现人群计数在智能安防领域具有重要价值。因此,人群计数(CrowdCounting)或者人群密度估计(CrowdDensityEstimation)是计算机视觉和智能视频监控领域的重要研究内容。

人群计数的通常的方法大致可以分为三种:1)行人检测:这种方法比较直接,在人群较稀疏的场景中,通过检测视频中的每一个行人,进而得到人群计数的结果,一般是用基于外观和运动特征的boosting,贝叶斯模型为基础的分割,或集成的自顶向下和自底向上的处理,这种方法在人群拥挤情况下不大奏效,需要运用到基于部件模型(如DPM)的检测器来克服人群拥挤遮挡的问题。2)视觉特征轨迹聚类:对于视频监控,一般用KLT跟踪器和聚类的方法,通过轨迹聚类得到的数目来估计人数。3)基于特征的回归:建立图像特征和图像人数的回归模型,通过测量图像特征从而估计场景中的人数。由于拥挤情况下采用直接法容易受到遮挡等难点问题的影响,而间接法从人群的整体特征出发,具有大规模人群计数的能力。

基于特征的回归一般分为以下3个步骤:1)前景分割:前景(行人或人群)分割的目的是将人群从图像中分割出来便于后面的特征提取,分割性能的好坏直接关系的最终的计数精度,因此这是限制传统算法性能的一个重要因素。常用的分割算法有:光流法、混合动态纹理、小波分析、背景差分等。2)特征提取:从分割得到的前景提取各种不同的底层特征,常用的特征有:人群面积和周长、边缘信息、纹理特征、闵可夫斯基维度等。3)人数回归:将提取到的特征回归到图像中的人数。常用的回归方法有:线性回归、分段线性回归、脊回归、高斯过程回归等[1]。可以通过发表于CVPR08的PrivacyPreservingCrowdMonitoring:CountingPeoplewithoutPeopleModelsorTracking[2]来了解以下整个算法流程。首先用动态纹理的方法分割出运动的人群,之后做视角归一化,在归一化后的人群块上提取特征,用高斯过程回归将提取的特征回归到图像中人群数量。系统框图如下:

2、单幅图像人群计数算法对于单幅图像而言没有运动信息,那么人群分割就显得非常困难,因此此类算法一般直接从整张图像或者将图像分块从其子区域提取特征,然后再计算图像中人群数量。图像分块可以理解为是一种离散化透视效果的方法。

1、Contributionsofthispaper

当前阶段人群计数的主要问题有以下几点:在大多数现有的工作中,前景分割是必不可少的,但前景分割是项艰巨任务;人群的密度和分布会有显著变化,因此传统的基于目标检测的模型很难workwell;需要一种有效的特征来针对图像中人群规模可能有显著变化的情况。基于以上问题,作者提出了一个基于CNN的新框架用于任意单幅图像上的人群计数。MCNN包含了三列具有不同滤波器大小的卷积神经网络。所做贡献如下:1)多列架构的原因是:三列对应于不同大小的感受野(大,中,小),使每个列卷积神经网络的功能对由于透视或不同的图像分辨率造成的人/头大小变化是自适应的(因此,整体网络是强大的)。2)用一个1*1滤波器的卷积层代替了完全连接的层,因此模型的输入图像可以是任意大小的,避免了失真。网络的直接输出是一个人群密度估计图,从中可以得到的整体计数。3)收集了一个新的数据集用于人群计数方法的评价。比现有的数据集包含更复杂的情况,能更好地测试方法性能,1198张图,330,165精确标定的人头。数据集分A和B两个部分,A是从互联网上随机找的图,B是上海的闹市截取图,如图5所示为A、B部分图。

2、Densitymapbasedcrowdcounting

给定一张图像,用CNNs来估计人数,一般有两种方案:一是输入图像,输出估计的人头数目;二是输出的时人群密度图(每平方米多少人),然后再通过积分求总人数。作者支持第二种,有以下两点原因:1)密度图保留更多的信息。与人群的总数相比,密度图给出了在给定图像中人群的空间分布,这样的分布信息在许多应用中是有用的。例如,如果一个小区域的密度比其他区域的密度高得多,它可能表明一些异常发生在那里。2)在通过一个CNN模型学习密度图时,学习到的滤波器更适应于不同大小的头,因此更适合于有透视效果显着变化的任意输入。所以这些滤波器具有更多的语义,提高了人群计数的准确性。

3、Densitymapviageometry-adaptivekernels

4、Multi-columnCNNfordensitymapestimation

MCNN主要是受到MDNNs[6]在图像分类上取得成功的启发而提出来的。MCNN网络的每一列并行的子网络深度相同,但是滤波器的大小不同(大,中,小),因此每一列子网络的感受野不同,能够抓住不同大小人头的特征,最后将三列子网络的特征图做线性加权(由1x1的卷积完成)得到该图像的人群密度图,类似模型融合的思想。采用了2*2的max-pooling和ReLU激活函数。(注意,因为这里用到了两次max-pooling,所以需要先对训练样本也缩小到1/4,再生成对应的密度图groundtruth)

5、OptimizationofMCNN

由于训练样本有限以及深度神经网路存在梯度弥散问题,会对参数学习造成困扰。作者借鉴RBM预训练的思想,通过直接将第四层卷积层的输出映射成密度图,分别对每一列CNN进行预训练。然后使用这些预训练的参数对MCNN的网络参数进行初始化,同时对所有参数进行微调。

6、TransferlearningsettingMCNN的一个优势在于能学习到不同大小人头对应的密度图。因此,如果该模型用一个包含各种大小人头的大数据集来训练,则该模型可以很容易地适应(或迁移)到另一个人头大小是一些特定的尺寸的数据集。如果目标域只包含少量的训练样本,可以简单地将MCNN的每一列前几层固定,只有微调最后的少量卷积层。这样固定前几层使在源域中学习的知识可以被保留,微调后几层很大程度上降低了模型适应目标域的计算复杂度。

1、Evaluationmetric

2、Shanghaitechdataset

4、Comparingperformances

MCNN方法在除了UCF_CC_50(训练图片数量太少,难以满足深度学习的需求)以外的常用人群计数数据集上均取得最好的性能。

5、Evaluationontransferlearning

这篇论文提出了的MCNN模型,能对任意视角的单张图像进行人数估计,并在常用人群计数数据集上均取得最好的性能。同时该模型可以较为容易迁移到针对另一人群目标域进行应用。

THE END
1.shanghaitech数据集使用MCNN进行人群计数:使用多列卷积神经网络对ShanghaiTech数据集进行人群计数 使用MCNN进行人群计数-MindSpark Hackathon 2018 使用多列卷积神经网络对ShanghaiTech数据集进行人群计数。 这是CVPR 2016论文“通过多列卷积神经网络进行单图像人群计数”的非正式实施。 注意:可以做出预测。 有关热图生成的工作正在进行中。 https://www.iteye.com/resource/weixin_41143397-11076450
2.ShanghaiTech数据集开发实例源码下载基于多列卷积神经网络的单图像人群计数的ShanghaiTech数据集【实例截图】【核心代码】 4744300845374237895.zip├── part_A_final│ ├── test_data│ │ ├── ground_truth│ │ │ ├── GT_IMG_100.mat│ │ │ ├── GT_IMG_101.mat│ │ │ ├── GT_IMG_102.mat│ │ │ ├── GT...https://www.haolizi.net/example/view_222890.html
3.ShanghaiTechShanghaiTech-A数据集,用于人群密度的评估。 数据集简介 此数据集图片来自于互联网图片,并且该数据集仅包含ShanghaiTech-A的测试图片,共计包含182张测试图片。 数据集格式 ShanghaiTech-A/ - *.jpg - *.mat 其中jpg和mat为同名数据对应的图片和GT标注 ...https://modelscope.cn/datasets/modelscope/ShanghaiTech-A/summary
4.ShanghaitechA数据集shanghaiTech数据集包含两部分:part_A_final,part_B_final A部分训练集:300张图片,测试集:182张图片。 part_A_final --- train_data ---test_data B部分训练集:400张图片,测试集:316张图片。 part_B_final --- train_data ---test_data A,B两部分测试集和...https://tianchi.aliyun.com/dataset/129503
5.基于卷积神经网络的复杂嘲人群计数算法研究.pdfShanghaiTech数据集上的MAE和MSE为61.7、7.8和99.6、12.8,结果表明所提算法 在人群非均匀分布的场景下具有较高的准确性和鲁棒性。 (2)针对复杂场景下背景噪声干扰和大规模尺度变化的问题,提出一种基于注意力 机制的多尺度融合人群计数算法。首先,构建基于残差连接的空洞空间卷积池化金字塔, 通过多个不同空洞率的空洞...https://max.book118.com/html/2024/0325/5322133022011131.shtm
6.资源人群计数最全资源(含代码工具数据集论文...ShanghaiTech Part B Year-Conference/JournalMethodsMAEMSE 2016--CVPR MCNN 26.4 41.3 2017--ICIP MSCNN 17.7 30.2 2017--AVSS CMTL 20.0 31.1 2017--CVPR Switching CNN 21.6 33.4 2017--ICCV CP-CNN 20.1 30.1 2018--TIP BSAD 20.2 35.6 2018--WACV SaCNN 16.2 25.8 2018--CVPR ACSCP 17.2 27.4 2018-...https://www.cvmart.net/community/detail/323
1.微软上海交通等发布首届数据污染报告,开闭源模型皆被污染简单来说,数据污染是指在自然语言处理中,评估数据被无意中包含在预训练数据集中,从而影响模型评估结果的情况。 为了深入研究数据污染问题,麻省理工、上海交通、哈佛大学、微软研究院、IBM、剑桥大学等20多家机构联合召开了首届数据污染(2024CONDA)研讨会,旨在收集当前可用数据集和模型中数据污染的证据并公布了实际情况。https://www.toutiao.com/article/7443973632038126090/
2.UCFCrime和Shanghaitech两个基准数据集训练集包含810个异常视频和800个正常视频,测试集包含140个异常视频和150个正常视频。 数据集提供视频级标注的训练集和帧级标注的测试集。 ShanghaiTech数据集: 包含437个高分辨率校园监控视频,覆盖了13个场景。 数据集中标注了130个异常事件,训练集由238个正常视频组成,测试集包含199个视频。 https://blog.csdn.net/weixin_41429382/article/details/144222042
3.上海十四五人工智能趋势人工智能是一门研究如何使计算机能够像人类一样进行智能行为的科学。上海十四五人工智能的趋势可以粗略地定义为在人工智能技术和应用领域的发展方向和发展态势。这包括了上海在人工智能算法、硬件设备、数据集和应用方面的进展。 二、分类 在上海的人工智能领域,可以将其分类为以下几个方面:机器学习、深度学习、自然语言处...http://www.hlwwhy.com/article/7126404.html
4.ShanghaiTechUniversityPearl Studio visits ShanghaiTech The leadership of Pearl Studio, a renowned international animation company and a member of the China Media Capital Group (CMC), visited ShanghaiTech University on November 21. They came to explore the possibility of cooperating with ShanghaiTech in cultivating animat...https://www.shanghaitech.edu.cn/eng/1001/list.htm
5.shanghaiTech数据集详细介绍shanghaiTech 数据集详细介绍 技术标签:深度学习计算机视觉pythontensorflow 查看原文 人群密度估计现有主要数据集特点及其比较 ShanghaiTechdataset 总共1198张标记图片,数据集分为两部分part_A和part_B,part_B部分的图片相较于part_A部分的图片人群分布更为稀疏。 MCNN中首次建立该数据集,part_A部分300张用于训练,182...https://www.pianshen.com/article/95011021159/
6.数据集ShanghaiTechDatasetOpenIShanghaiTech.zip 333 MiB CPU/GPU 公开 2023-02-03 17:18:56 下载预览 共1 条 1 前往 页 删除该版本的数据集 你确定要删除该版本的数据集么?一旦删除不能恢复。 取消操作 确认操作 请仔细阅读下方内容: 尊敬的启智用户 感谢您一直以来对Openl启智社区AI协作平台的支持。为了保障您的使用权益和确保网络安全...https://openi.pcl.ac.cn/Wan_/ShanghaiTech-Dataset/datasets
7.shanghaitech数据集黑蕾**nc上传166.33 MB文件格式zip图像分类人群计数 shanghai数据集用于行人密度识别、适用于MCNN人群密度估计 (0)踩踩(0) 所需:1积分 debugpy-1.7.0-cp310-cp310-win32.whl 2024-11-15 14:35:43 积分:1 debugpy-1.7.0-cp37-cp37m-win32.whl ...https://www.coder100.com/index/index/content/id/1603139
8.上海疫情最新发现,科技之光助力抗疫之路,前沿科技产品变革体验...这款高科技产品是一款集智能监测、数据分析、健康管理于一体的智能防疫终端,它集成了最新的生物识别技术、人工智能技术和云计算技术,为疫情防控提供了全新的解决方案。 功能亮点 1、智能监测:该终端可实时监测用户的健康状况,包括体温、血氧、心率等关键指标,并通过生物识别技术对用户身份进行确认,确保数据的准确性。 http://www.szjygg.com/post/19305.html
9.rpc数据集图像分割图像数据集处理读取数据集 1. ShanghaiTech 2. UCF-QNRF 数据持久化 1. h5py存储数据 2. numpy存储:数组、字典 路径类 1. 获取一个路径最后一个目录或文件的名字 os.path.basename("D:\Project\AI-learning\Pytorch-UNet\data\masks\IMG_100_mask.npy") # 输出: IMG_100_mask.npy ...https://blog.51cto.com/u_16213650/10319317
10.CSRNet:DilatedConvolutionalNeuralNetworksfor...1、ShanghaiTech数据集 ShanghaiTech人群统计数据集包含1198个注释图像,总数为330,165人。这个数据集由两部分组成,分别是A部分,其中包含482个图像,随机从互联网上下载高度拥挤的场景,而B部分包括716张图像,上海街道上有相对稀疏的人群场景。 ShanghaiTech数据集结果.png ...https://www.jianshu.com/p/feda02961e31
11.多元信息聚合的人群密度估计与计数由ShanghaiTech数据集实验结果可知,在Part_A中,本文算法MAE与文献[21]方法相比下降了2.9,MSE下降了3.8;在Part_B部分,与文献[21]方法相比,MAE下降了0.1,MSE下降了0.3,提升幅度较Part_A小。这主要由于本文多元信息提取方法侧重提升高密场景特征捕获能力,故在以密集人群为主的Part_A部分效果较好,而在以稀疏人群为主...https://www.fx361.com/page/2022/0601/16378342.shtml
12.数据集人群统计 3 个公开数据集 FDST 人群计数数据集 FDST 全称 Fudan-ShanghaiTech,是一个视频人群计数数据集。该数据集包含了从 13 个不同的场景中的… 人脸检测 59 个公开数据集 VGG-Face2 人脸识别数据集 VGG-Face2 Dataset 是一个人脸图片数据集,包含共计 9131 个人的面部数据,图像均来自 Google … ...https://hyper.ai/?p=17124
13.opendatalab.com/OpenDataLab/ShanghaiTechShanghaiTech 异常检测人群计数-Crowd Counting视频中的异常事件检测-Abnormal Event Detection In Video 标注类型-Label type 简介-Introduction Shanghaitech 数据集是一个大规模的人群统计数据集。它由 1198 个带注释的人群图像组成。数据集分为两部分,Part-A 包含 482 张图像,Part-B 包含 716 张图像。 Part-A...https://opendatalab.com/OpenDataLab/ShanghaiTech
14.基于轻量级卷积神经网络的人群计数算法研究另外,在ShanghaiTech数据集、UCF-QNRF数据集以及UCF CC 50数据集上进行测试,MobileFusion均表现出优秀的性能;其次,针对编码结构,对MobileFusion进行改进,搭建出了更加轻量的人群计数模型,将其称为GhostFusion。该模型的编码结构基于GhostNet中的Ghost模块搭建而成。另外,为提升模型的精度,在编码结构中分别引入轻量级的...https://wap.cnki.net/lunwen-1021175438.html