qianli8848的个人博客分享 http://blog.sciencenet.cn/u/qianli8848

博文

几个视频中行为识别的底层特征及代码

已有 9301 次阅读 2012-8-22 09:05 |个人分类:CODE|系统分类:科研笔记| 特征, 计算机视觉, 模式识别, 机器学习, 行为识别

1. 比较出名的是Ivan Laptev的 3D Harris,这是一个可执行文件,用起来比较方便,是Harris在3维空间的扩展,检测到特征点之后是用HOG和HOF进行表示。一共的特征维数是162维。点击这里进入下载界面。

2. P. Dollar的cuboids角点检测,方法大致是用1D的gabor进行滤波。检测到角点之后,作者的实验表明直接用cuboids里面的梯度作为表示,然后再进行降维。我认为这个方法的缺点是降维之前的维数太高,求协方差矩阵特征值所花费的时间比较多(一般降维前的特征都是上万维的)。但是这个算法的一个好处是可以控制每个视频提特征点的个数。所以现在这个特征用的人是最多的。代码需要给作者发邮件获取。

3. Alexander Klaser的3D HOG不需要进行特征点检测,是对视频进行稠密采样,提取3D HOG特征。点击这里下载。这种稠密采样的特征在UCF Sports这个数据库上面的效果很好。

4. Paul Scovanner 的3D SIFT,同样也是将图像中很火的SIFT扩展到3维情况。但是这个特征用的人相对较少。
点击这里下载。


https://blog.sciencenet.cn/blog-722391-604663.html

上一篇:两个Multi-task learning(多任务学习)的代码
下一篇:Fully Automatic Multi-target Tracking System
收藏 IP: 159.226.20.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 18:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部