欢迎来到论文网! 识人者智,自知者明,通过生日认识自己! 生日公历:
网站地图 | Tags标签 | RSS
论文网 论文网8200余万篇毕业论文、各种论文格式和论文范文以及9千多种期刊杂志的论文征稿及论文投稿信息,是论文写作、论文投稿和论文发表的论文参考网站,也是科研人员论文检测和发表论文的理想平台。lunwenf@yeah.net。
您当前的位置:首页 > 科技论文 > 计算机论文

一种适合足球视频镜头分割的算法_主色提取-论文网

时间:2015-02-25  作者:曲泽超,高振天

论文摘要:镜头分割是视频分析检索的基础,为了使镜头分割技术在足球视频中得到更广泛的应用,本文详细介绍并实现了一种适合足球视频的自适应阈值镜头分割算法。实验表明,本算法在处理镜头分割时,算法速度快、实时性好,与传统算法相比,在查全率和查准率方面,都有很大提高。
论文关键词:镜头分割,主色提取,自适应阈值

0引言

镜头分割是视频分析处理的第一步,是随后的视频内容分析、分类、索引和查询的基础。因此,视频镜头的分割算法,从一开始就得到广泛的重视,它在基于内容的视频分析和检索中有着最长的研究历史和最丰富的研究成果。但是直到今天,仍然没有相当高效、实用的分割算法出现。本文试图通过分析以往几种传统的镜头分割算法,从原理及用途上加以概括和总结,提出一种适合足球视频的高效的自适应阈值的镜头分割算法。

1镜头分割技术分析

镜头分割作为视频检索的基础环节,对整个视频分析起到了关键的作用,它的精度直接影响着后面几个环节乃至整个视频检索系统或者生成视频摘要的准确率。镜头分割也叫镜头分段或镜头边缘检测,从大的角度出发,镜头间的转换分为切变和渐变。切变指从某一镜头突然跳到另一镜头,转变过程快而且没有加入过渡效果。对于切变,检测起来相对简单,现有的一些算法已经可以达到较高的精度;渐变是指从某一镜头逐渐过渡到另一镜头,中间有较短时间的延迟,而且伴有丰富的过渡效果。例如:淡入淡出、渐隐渐现、融入融岀、叠加、扫换等等,对于渐变,因为过渡效果复杂多变,检测起来难度很大,目前,只针对某种或某几种的检测算法精度还算令人满意。因此,渐变检测仍然是镜头分割领域的一大难点。下面介绍一下几种典型的镜头分割算法,通过认真分析这些算法,实现了一种适合于足球视频检测的自适应阈值分割算法。

比较典型的镜头分割算法主要分为四大类:基于像素的算法,基于颜色直方图的算法,基于运动矢量的算法和基于压缩视频的算法。这些算法的基本思想是:通过提取各自不同的视觉或运动特征,比较相邻帧之间的特征差值,若差值大于设定阈值,就说明视频镜头发生了转变。

1.1基于像素的算法

当视频从一个镜头转换到另一个镜头时,相邻图像帧对应像素的差值会发生很大变化,当这一差值大于某一设定阈值时,说明镜头发生了转换,这是基于像素进行镜头边缘检测的基本原理。总的来说,影响图像中像素变化的因素有:摄像机的运动、变焦、视频对象的运动以及闪光灯的影响,另外,发生渐变时,过渡效果的影响也很严重。Zhang,Kankanhali和Smoliar对此算法进行了改进,先对图像进行3×3矩阵滤波,减少摄像机移动和噪声对图像像素的影响,结果他们注意到对不同的视频流采用不同的阈值会得到较令人满意的效果,但是这种方法速度慢,而且阈值提前设定,需要人工调整,如果处理大数据量的视频集,后果将难以想象。Kasturn和Jain对像素差法做了扩展,通过计算图像子块区域中像素点的灰度平均值和标准差,来检测视频镜头边缘。这种方法虽然有较好的容错性,但计算量太大。因此,总的来说,单纯利用像素差值算法进行镜头边缘检测效果并不好。

1.2基于颜色直方图的算法

颜色直方图算法是帧间像素差法的发展,最简单最基础的是比较相邻图像帧的灰度或颜色直方图,如果差值大于设定的阈值,就认为检测到切分点。基本公式见式(1.1)。

(1.1)

分别代表图像帧和相邻图像帧,j代表像素值,[0,N]代表颜色值域。H代表颜色直方图值即图像帧在某一像素值处像素个数。

Nagasaka和Tanaka把图像分成16个子块区域,计算每个子块区域里的直方图,并比较相邻图像之间的所对应16个子块直方图,舍弃8个最大的差值,这样减少了摄像机移动和镜头内物体移动噪声的影响。Swanberg,Shu和Jain等人对此算法进行改进,对区域颜色直方图加权值,根据视频流内区域变化设定权值。在两个图像比较中,有可能某些颜色对于比较的结果更重要,因此,应该给这些颜色赋予更大的权重。

1.3基于运动矢量的算法

在镜头分割技术中,针对视频数据运动特征的分析方法有基于光流方程的方法、基于块匹配的方法、像素递归方法和贝叶斯方法等,这些方法均可以描述视频序列运动信息。例如,在基于块匹配的运动估计算法中,每帧图像被分成二维的N×N像素的子块。假定每个子块内的像素都作相等的平移运动,当前帧的N×N子块在上一帧对应的子块邻域窗口内搜索到与之最匹配的子块,当前子块与匹配块在二维平面上的位移即为运动估计得到的运动矢量。通常利用得到的运动矢量特征来判断镜头中是否含有大量的相机或对象运动,这样可以避免由于摄像机运动给镜头渐变检测带来的误检。另外,为了保证在每一个块中运动矢量的唯一性,应选择较小的块,而这也意味着每帧图像中子块的数目将会比较多,因而在分析过程中需要存储和传输的信息量较大。针对这种不足,Salari0等人提出了一种快速算法-连续排除算法(SuccessiveEliminationAlgorithm,SEA),该算法降低了计算量,提高了运算速度。除此之外,有人用四叉树分解算法估计分析视频序列运动特征,起到了较好的效果。但是算法复杂度较高,并没有得到广泛的利用。

查看相关论文专题
加入收藏  打印本文
上一篇论文:一种新型的流媒体系统设计与实现_反馈机制-论文网
下一篇论文:将自然辩证法融入到信息技术教学中_计算机语言-论文网
科技论文分类
科技小论文 数学建模论文
数学论文 节能减排论文
数学小论文 低碳生活论文
物理论文 建筑工程论文
网站设计论文 农业论文
图书情报 环境保护论文
计算机论文 化学论文
机电一体化论文 生物论文
网络安全论文 机械论文
水利论文 地质论文
交通论文
相关计算机论文
    无相关信息
最新计算机论文
读者推荐的计算机论文