当前位置: 代码网 > 科技>人工智能>智能机器人 > 计算机视觉概念考点汇总

计算机视觉概念考点汇总

2024年08月02日 智能机器人 我要评论
成都理工大学期末复习概念性知识点汇总(计算机视觉)

ps:有的概念内容较多,需要自己看书理解。会标明书页。

书籍:计算机视觉教程 章某版本 微课 | 第三版

第一章
1.计算机视觉基础知识,人类视觉知识
人类视觉可以看做一个复杂的从感觉到直觉的过程,感受到的是3d对2d的投影,从2d图像认识3d世界的过程。
计算机视觉是模仿人类视觉实现对环境的感知,加工,解释。
2.计算机视觉研究方法
仿生学方法。
工程学方法。
3.研究目标
建立计算机视觉系统来完成各种视觉任务。
研究计算机视觉来探索人脑视觉的机理,掌握和理解人脑视觉的工作机理。
4.几个主要相关学科
计算机图形学,图形工程,人工智能和深度学习,模式识别,机器视觉和机器人视觉。
5.研究领域
工业视觉 人机交互 安全监控 遥感测绘 军事公安 视觉导航 生物医学 虚拟现实 图像自动解释。
6.常见图像类别
bmp gif tiff jpeg
8.像素邻域
像素邻域是指在数字图像中,某个像素周围的一组相邻像素。它用于描述一个像素与其周围像素之间的关系和相互影响。
9.距离和邻域尺寸之间的关系
距离和领域尺寸之间有一定关系。在一维或二维空间中,可以使用不同的距离度量(如欧氏距离、曼哈顿距离)来衡量点或像素之间的距离。邻域尺寸表示距离的范围,较大的邻域尺寸可包含更远的距离,而较小的邻域尺寸则限制了距离的范围。选择合适的邻域尺寸取决于具体问题和算法的需求。
10.计算机视觉的框架及核心模块(图)

第二章
2.典型的采集装置优缺点。
ccd:图像质量高,低噪声,全局快门,适用静态捕捉。辐射抗干扰好。
           成本高,高功耗,不适合高帧频应,高温环境暗电流。
cid:图像质量相对较差,高噪声,不适合静态捕捉。
          成本低,低功耗,适应低光环境。
cmos:图像质量相对差,高噪声,支持连续图像捕捉。
             高集成,低成本,低功耗,低光条件灵敏性差。
3.基本性能指标
线性响应
灵敏度
信噪比
阴影
快门速率
读取速率
4.图像采集的基本模块
图像传感器、光学元件、信号处理电路、控制单元、存储单元和接口模块。
5.几何成像模型(重合模型)分离模型
6.图2.2.4 公式2.2.23
p29
7.亮度成像模型
亮度成像模型是一种图像处理的方法,用于增强图像中的亮度信息。其基本原理是根据图像中像素的亮度值,调整像素的灰度级别或对比度,以提高图像的可视性和细节。
8.图像的空间分辨率和幅度分辨率与数据量的关系
空间分辨率:增加图像的空间分辨率会导致数据量的增加。更高的空间分辨率意味着图像中有更多的像素需要存储和处理,因此需要更多的数据量。
幅度分辨率:幅度分辨率的增加也会增加数据量。更高的位数或比特数表示每个像素可以存储更多的颜色或灰度级别,因此需要更多的数据来表示每个像素的值。
9.常见的成像方式 结构光成像的基础
方式:单目成像,双目成像,多目成像,光移成像,主动视觉成像,视频/序列成像,结构光成像。
10.摄像机标定 一般程序和步骤 两级标定法的具体步骤 熟悉张正友标定法
摄像机标定程序:获得m≥6个具有已知世界坐标的空间点。用摄像机在给定位置拍摄这些点得到图像平面坐标。代入公式解未知数。
摄像机标定步骤:许标定的参数是旋转矩阵r和平移矢量t。标定焦距。标定失真系数k,标定不确定性图像尺寸因子μ。


第三章
1.常见边缘检测的微分原理,典型的1,2阶倒数算子
一阶导数算子:罗伯特交叉算子,普瑞维特算子,索贝尔算子
二阶导数算子:拉普拉斯算子,马尔算子,坎尼算子。
2.susan算子原理 计算方法 特点
原理:原理是寻找局部区域中灰度值变化最小的像素点作为核心点,并计算与核心点相似的像素点数量来确定边缘或特征。
特点:对边缘和角点检测时不需要计算微分。
          边缘变得模糊,在中心区的usan区面积减少。
          能提供不依赖模板尺寸的边缘精度。
3.hrris算子原理计算方法
原理:harris算子是一种基于图像局部灰度变化的特征检测算法,通过计算像素点在各个方向上的梯度和协方差矩阵,以判断该点是否为角点或具有角点特征。
          计算方法:

4基本的哈弗变换,用于检测直线段或具有简单几何形状的基元。
利用点线对偶性,将图像空间的直线检测问题转化为参数空间的点检测问题。
5.椭圆定位和检测的基本技术

第四章
1.显著性的定义内涵和特点
内涵:
特点:高层语义特征,认知稳定性,全局稀缺性,局部差异性。
2.其与视觉注意力机制和模型的关系,显著性检测的方法和流程
显著性和注意力机制在模型中的结合可以增强模型的感知能力和推理能力,提高模型在各种任务中的表现。
p78
3.几种基于对比度检测图像中显著区域的方法
对比度算法分类:利用局部对比度先验知识,利用全局对比度先验知识,利用背景先验知识。


第五章
1.基于轮廓进行搜索的目标分割方法。
图搜索方法和动态规划方法。
2.主动轮廓模型:p102
3.基于区域的目标分割方法,全局,局部,动态阀值方法。
全局阈值方法:仅根据各个图像像素的本身性质f(x,y)来选取而得到的阈值。
局部阈值方法:根据像素本身性质f(x,y)和像素周围局部区域性质q(x,y)来选取而得到的阈值。
动态阈值方法:根据像素本身性质f(x,y)和像素周围局部区域性质q(x,y),和位置坐标(x,y)得到的阈值。
前两种称为固定阈值。
4.阀值分割方法,推广到特征空间,特征空间聚类方法进行目标分割。
基本聚类方法:k-均值聚类  isodata聚类 


第六章
1.基于边界的表达方法的原理,链码(及中点缝隙码)边界段,边界标记等四种典型方法。
基于边界的表达利用对图像进行分割所得到的目标边界上的像素点来表达目标,属于外部表达法。
链码边界段:链码对边界的表达是逐点进行的,而一种更节省数据量的方法是把边界分解成若干段分别表示。将边界分解成多个边界段的工作可以利用凸包来进行。
边界标记四种典型方法:距离为角度的函数   φ-s曲线  斜密度函数 距离为弧长的函数
2.给予边界表达的方法的原理,四叉树表达,金字塔表达等四种方法。
基于边界表达的原理是一种通过定义匹配字符串的开始和结束边界来进行模式匹配的方法。它在有穷状态自动机中进行状态转换,并根据输入符号是否处于边界位置来确定匹配结果。
四叉树表达:四叉树表达利用金字塔式的数据结构对图像进行表达。
金字塔:四叉树是一种特殊的金字塔,其中不同层之间的变化是类似的。而且没有考虑同一层的联系。其实,金字塔是一种更一般化的数据结构,不同层之间的变化很大,同一层也可有各种联系。
3.边界的描述方法,边界长度和边界直径描述符。
边界的长度和直径 边界形状数 轮廓形状矩阵
4.基于链码的边界形状以及形状矩阵方法。

5.基于区域的目标描述特征发放,区域面积和密度描述符,区域形状数。
区域密度和面积:p134 
区域形状数:


第七章
1.纹理的描述方法
统计法:统计法中纹理被看做一种区域中某种特征分布的定量测量结果。最简单的统计法直接借助于图像的灰度直方图的矩来描述直方图并进而描述纹理。
2.基于共生矩阵的描述,结构描述方法
结构法是一种空域方法,其基本思想是复杂的纹理可由一些简单的纹理基元,以一定的有规律的形式排列组合而成。p147
3.确立纹理基元,建立排序规则
确立纹理基元:首先,你需要选择适当的纹理基元。纹理基元可以是任何形状、大小或特征,在纹理识别中具有代表性。常用的纹理基元包括小块区域、线段、边缘或特定模式。
特征提取:使用合适的图像处理算法,对待处理的图像进行纹理特征提取。常用的纹理特征包括灰度共生矩阵(glcm)、局部二值模式(lbp)、方向梯度直方图(hog)等。这些特征可以描述纹理的统计信息、结构特征和空间分布。
特征表示:将纹理特征转化为合适的表示形式,以便进行排序和比较。常用的方法包括将特征向量归一化、降维或者构建特征描述子。
排序规则确定:根据你的需求和应用场景,确定适当的排序规则。排序规则可以基于纹理特征的相似度、距离或者其他特定的标准。常见的排序方法包括欧氏距离、余弦相似度、基于机器学习的排序等。
4.纹理描述的频谱方法
傅里叶变换谱:使用傅里叶变换将图像从空间域转换到频域,获取图像纹理在频率分量上的能量或幅度信息。可以通过计算频率分量的功率谱密度、能量谱密度或振幅谱密度来描述纹理特征。
小波变换:小波变换将图像分解为不同尺度的频域子带,提取每个尺度的纹理信息。常用的小波变换方法包括离散小波变换(dwt)、连续小波变换(cwt)和快速小波变换(fwt)等。
全局和局部二维离散余弦变换:二维离散余弦变换(dct)将图像转换为频域系数,可以捕获纹理在不同频率下的分布情况。全局dct将整个图像应用于变换,而局部dct仅对图像的局部区域进行变换。
高通滤波器:高通滤波器可用于突出图像中的高频纹理信息。常见的高通滤波器包括拉普拉斯滤波器、边缘增强滤波器等。通过对滤波后的图像进行分析,可以得到纹理的频率特征。
5.纹理分割的思路和方法
基于像素级的方法:这种方法主要基于局部纹理特征,通过对每个像素或像素邻域进行纹理相似度度量,将具有相似纹理特征的像素划分到同一个区域。常见的算法包括基于聚类的方法(如k-means、mean shift)和基于像素分类的方法(如支持向量机、随机森林等)。
基于区域生长的方法:这种方法从一个或多个种子点开始,通过对相邻像素的相似性进行判断和合并,逐渐生长形成具有相似纹理的连通区域。区域生长算法通常需要定义合适的停止准则和生长规则,例如基于纹理距离、颜色距离、梯度边缘等。
基于能量优化的方法:这类方法将纹理分割看作是一个能量优化问题,通过定义能量函数,并利用图割算法、马尔可夫随机场等优化技术来最小化能量函数,从而得到纹理分割结果。常用的能量函数包括纹理相似度、边缘一致性等。
基于深度学习的方法:近年来,深度学习技术在图像分割领域取得了巨大的进展。通过使用卷积神经网络(cnn)、编码器-解码器结构(如u-net)等,可以学习到图像中的纹理特征和语义信息,实现高效准确的纹理分割。

第八章
1.五种常用的描述形状紧凑性的描述符:外观比r 形状因子f 球状性s 圆形性c
2.形状复杂性的简单描述符
细度比例:形状因子的倒数(4π(a/b²))
面积周长比:a/b
矩形度
与边界的实际距离
轮廓温度
3.对复杂目标轮廓用条边形状来近似逼进的表达方法和形状分析方法。
4.离散边率的计算方法。

第九章
1.立体视觉系统的基本模块和功能
视差计算:视差是指左右两个视点(摄像头)之间同一物体在图像中的像素偏移量,通过计算视差可以得到物体的深度信息。视差计算模块负责对左右图像进行匹配,找到对应像素的位置差异,常用的算法包括块匹配、全局优化等。
立体校准:为了保证视差计算的准确性,需要对摄像头进行校准,确定左右图像之间的几何关系。立体校准模块通常包括相机标定,求取摄像头的内参和外参,并对图像进行畸变矫正,以提高匹配精度。
深度图生成:通过视差计算得到的视差图,可以进一步转换为深度图。深度图表示每个像素的距离信息,可用于重建三维场景或进行目标检测与跟踪。深度图生成模块将视差图转换为带有实际物理尺寸的深度图像。
立体匹配优化:视差计算过程中可能会存在误匹配或不一致的问题,立体匹配优化模块可以对视差图进行后处理,去除无效区域、填补空洞,并应用滤波和平滑操作以改善深度图质量。
三维重建:根据深度图和立体校准参数,可以进行三维场景的重建与模型生成。三维重建模块可以将二维图像信息还原为三维物体的几何结构,并生成点云、网格或体素表示等三维模型。
目标检测与跟踪:利用立体视觉系统获取的三维信息,可以进行目标检测与跟踪。通过在三维空间中定位目标,可以实现更精确的目标检测和跟踪,适用于自动驾驶、智能监控等领域。
2.视差和深度的概念
视差(disparity):视差是指左右两个视点(通常为摄像头)所观察到的同一物体在图像中的像素位置差异。由于左右眼观察同一场景时,根据物体在空间中的位置不同,它们在左右视图中的表现也不同。通过计算视差,可以推断出物体相对于摄像头的距离或深度信息。视差越大,物体离相机越近;视差越小,物体离相机越远。
深度(depth):深度是指物体相对于摄像头的距离或者三维空间中的坐标。在立体视觉中,通过视差计算得到的视差图可以进一步转换为深度图。深度图表示了每个像素点的距离信息,可以用来还原三维场景或进行目标检测与跟踪。深度值越小,物体离摄像头越近;深度值越大,物体离摄像头越远。
3.双目成像和视差计算之间的关系
双目成像为视差计算提供了获取视差信息的基础数据,而视差计算则利用双目成像所获取的图像来推断物体的距离和深度。这种关系使得双目视觉成为一种常用的用于获取三维信息的方法,被广泛应用于计算机视觉、机器人、虚拟现实等领域。
双目成像的基本模式:双目成像的基本模式包括平行轴模式和共轴(中间轴)模式。横向会聚纵向。
4.基于区域立体匹配的方法:模板匹配,双目立体匹配。

第11章
1.运动的分类和表达:
摄像机静止,景物运动
摄像机运动,景物静止
摄像机景物都运动
前景运动,背景运动。
2.基于目标检测跟踪
基于单高斯模型的方法
基于视频初始化的方法
基于高斯混合的方法
基于码本的方法

第十五章
1.线条图标记:
刃边。翼边。折痕。痕迹。阴影。

2.计算机视觉的系统模型
多层次串行
以知识库为中心
以知识库为根
多模块交叉配合

3.视觉理论框架
计算理论到算法实现和硬件实现。算法实现和硬件实现互相指。

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com