计算机视觉(Computer Vision),计算机图形学(Computer Graphics)和数字图像(Image Processing)

发布时间 2023-08-17 19:09:16作者: 王闯wangchuang2017
计算机视觉(Computer Vision),计算机图形学(Computer Graphics)和数字图像(Image Processing)
从学科分类:
Computer Science/ Artificial Intelligence/ Computer Vision
Computer Science/ Computer Graphics and Visualization
Electrical Engineering/ Signal Processing/ Digital Signal Processing/ Digital Image Processing
举例:
Computer Vision: 照相机笑脸识别
Computer Graphics: 3D游戏电影制作
Image Processing: PhotoShop 以及App中的各种照片滤镜特效
 
 
Computer Vision 关系于 AI (Artificial Intelligence)
Computer Graphics 涉及于 交互 绘制 等 例如 几何图形的输入和存储 虚拟现实技术 动画技术 这就是我们常说的CG
DIP=Digital Image Processing 涉及于信号处理 图像的降噪 压缩 等
 
计算机视觉本质上是模式识别 是人工智能的东西,这方面我不太了解,我更多说说图形学。
计算机图形的主要目的是用计算机生成具有三维真实感的画面,应用举例来说比如皮克斯的三维动画。
图形学要解决的问题主要包括,建模,渲染,以及某些物理模拟。
建模就是用曲面生成现实世界物体的模型,比如三角面片或者四边形网格,或者是用粒子来模拟流水火焰。
渲染是对模型和场景上色的过程,这也是最耗时的一个步奏,基本上渲染可以分为物理真实的(physically based)和NPR(非照片级真实的)两类,physically based 渲染往往需要大量时间,算法有 path tracing; radiosity等等。
本质上都是Monte-carlo方法和有限元法在计算机领域的应用。
而游戏里的渲染基本上做不到physically-based 往往是接近这个效果,游戏里的渲染很多采用基于屏幕空间的延迟渲染来实现。
物理模拟也有很多方面,最复杂的当然是流体的模拟,比如火焰,爆炸等等
 
 
1 计算机视觉,里面人工智能的东西更多一些,不仅仅是图像处理的知识,还涵盖了人工智能,机器学习等领域知识;2,计算机图形学,主要涉及图形成像及游戏类开发,如opengl等,还有就是视频渲染等;3,图像处理,这个主要针对图像图像的基本处理,如图像检索或则图像识别,压缩,复原等等操作。
 
 
计算机图形学研究的是如何将三维信息投影到一个二维平面上,例如游戏中常用到的3D场景渲染;
图像处理顾名思义就是处理图像的像素,例如高斯模糊;
计算机视觉的输入是图像,输出是三维的信息,例如基于图片的三维重建技术;
大家常见的VR技术跟计算机图形学相关,而AR技术和图形学和计算机视觉都相关,自动驾驶技术和计算机视觉相关。
 
可以从三个方向的终极目标来理解:
Computer Vision 的终极目标是模仿人眼和大脑对看到的真实事物的理解,关键词是“真实”和“理解”,如人脸识别;
Computer Graphics 的终极目标是创造非真实的视觉感知,关键词是“非真实”和“创造”,如3D特效;
Image Processing 的终极目标是图像转换,像素级的处理,关键就是图像与图像的转换。
 
 
通俗的讲,如果比喻成一个人,计算机视觉就是研究怎么让计算机具备人类视觉的功能,研究怎么让计算机从图像、视频中获得有用的信息,偏向于应用;
数字图像处理是计算机视觉必备的理论基础,研究的是如何使计算机从图像、视频(其实就是矩阵)等资源中具备识别的功能,偏向于理论;
计算机图形学研究如何让计算机具备绘图的功能,偏重于二维、三维的显示。
 
 
CG和CV的最大区别:CG是模型到图像,CV是图像到模型
计算机图形学的输入是模型,输出是图像(像素)
计算机视觉的输入是图像(摄像机拍摄的照片或视频),输出是模型
 
数字图像处理的输入是图像(像素),输出也是图像(像素)
 
 
简直吐血,好像计算机图形学就是搞渲染。
计算机是为了“计算“的,“显示“只是副产品。
图形学的核心是几何,几千年来如此。
至于渲染火过那么一阵,只是图形学为了将就一下落后的二维显示器。
翻翻siggraph近年的paper,还有几个搞渲染的。
 
计算机视觉,在图像中用数学方法提取有意义的数据,比如人脸轮廓。计算机图形,用数学描述图形并在计算机中由点,线,面实现并转化为图形,赋予材质后渲染成图像,比如,3D建模。数字图像处理,对图像用数学方法进一步加工处理使其成为想要的图像,比如PS中一系列操作,比如图像去噪,图像复原,图像篡改。三者都会生成或利用图像为基础,共同点是都离不开数学。
 
0
 
 
CG:脑袋里有个东西,我没见过,我用计算机点线,加点颜色,纹理,把我脑袋里的东西表现出来。恩,这样。
CV:脑袋里有个东西,显示里也有个东西,我搞一搞,用计算机看看这现实里的东西是不是就是我脑袋里想的。
图像:现实里有的,我照下来了,但是感觉我想要拍的那个不明显,我搞一搞,用计算机处理一下,别人一看就知道我想拍的是表达的什么。
 
计算机图像学是自己创造图像,无中生有;图像处理是对已有图像进行处理,有中生无;计算机视觉是在图像处理的基础上提取高层信息,其核心是模式识别和机器学习的算法。
 
不确切的描述:
计算机视觉≈看图
计算机图形学≈画图
数字图像处理≈看图前沐浴更衣焚香做好各种仪式,然后再看图
 
第一个和第三个的看图主体并不是同一个。
计算机视觉≈计算机看外部的图。
计算机图形学≈计算机画图。
数字图像处理≈计算机看外部的图,利用自己的画图技术做出变更,再导出后是人看图。
 
 
 
计算机图形是把牙膏挤出来,计算机视觉是把牙膏灌回去。
从数据生成图像,你一开始的信息是完整的。
从图像回推数据,你的信息是残缺的,一些数据是按“规律”猜的。
计算机图形学是牙膏是怎么寄出来的,计算机视觉是通过挤出来的牙膏给出牙膏是怎么挤出来的
 
我用最简单的例子来说吧
数字图象处理,ps就是最浅显的例子,把一幅图像去去躁,做做直方图均衡化之类
计算机视觉,人脸识别,指纹识别。别告诉我连这俩你也没听过
计算机图形学,迪士尼的各种3维动画片,好莱坞的各种特效
说浅了,上述就是这三个领域的一部分
说深了,则包含很多子分类内容以及交叉领域
计算机视觉一般都要用到数字图象处理,比如灰度、二值、直方图
计算机图形学也会使用计算机视觉,比如好莱坞做特效的时候一般都是用标记以及绿幕,这就是方便将特效部分替换上去,而为了替换的更加真实,就会涉及到识别的东西
至于图像处理,里面也会包含到其他领域
 
简单而本质的概括一下。
图像处理的输入是一副图像,输出还是一副图像。
计算机视觉可以理解为图像分析,其输入是图像,但输出是对图像的描述。
而计算机图形学则与计算机视觉相反,其输入是描述性内容,输出是图像。
 
简单的说图形学与图像处理互为逆过程。图形学是利用计算机生成图像,这是得依靠算法实现的。例如样条曲线等等。图像处理则是将外部摄入的图像进行处理,对图像进行增强.分析.通信等操作。
其实呢,只要知道图形与图像的区别,这些概念还是很简单的。
 
图像一般指计算机类以位图形式存在的灰度信息,
图形含有几何属性,例如点线面这些属性