• 评论

  • 分享

  • 收藏

【反老法师通俗演义】图像质量评价标准基础科普(1)

刘庆

2018-12-25 15:11浏览 0



本文版权所有,禁止任何形式的商业转载与使用。谢绝任何XXX和微博转载,违者必究。

虽然机器是人制造出来的,但人类和机器面对这个世界时候“观察”和“思维”的方式,甚至比人和狗之间的差距还要大。

老夫作为一个已经习惯机器思维方式的人类,每每跟人类中的萌妹子交流的时候都会压力山大,其实是一个不错的例证。

嗯跑题了。下面正式开始。

注意,在下面的分析当中我们提到的所有“图像”都指的是灰度图像。对于彩色图像,实际上是三张灰度图像的加权叠加,分析方法完全一致。为了讨论简便,做此说明。

 

第一章 万事皆信号 万物皆系统

让我们从一个叫做“信号”的词说起。

提到信号(Signal)这个词,大家首先想到的是什么?

是交通信号灯?

还是手机信号?

而当数学家们说起“信号”的时候,他们脑海中想到的并不是交通指示灯所发出的闪烁光芒或者手机屏幕顶部的天线图案,而是一段可以被携带与传播的信息,可以是声音,可以是图像,也可是遥感测量数据。简单地说,它是一个函数,定义在通常的一维或者多维空间之上。

而系统这个词是伴随着信号而生的。一个事件的发生,在信号学上就被认为是一个信号通过一个系统(System)得到的一个响应(Response)。比如拍照这个过程,可以认为是外界携带信息的光线通过相机镜头这个系统,得到了一个被叫做图片的响应。

实际上,声音就是一种非常典型的信号——无论是在信号与系统的专业研究当中,还是在我们的日常生活上,都非常易于理解“声音信号”这个词的概念。

按照我们上面对于信号这个词的定义,不难理解图像其实也是完全符合这种定义的,实际上,一张图片可以被看做一个三维空间中的函数f(l,x,y),其中(x,y)是每一个像素点的坐标,而l的值就是这个像素的亮度。

对应的,声音信号是一个二维空间中的函数f(x,t),t是时间,而x指的是该时间点处声音的强度。

从这种简单的类比当中我们可以得出一个结论——图像和声音,实际上是可以采用完全相同的研究方式的。甚至一个三维的图像,完全可以通过下面的方式转换成二维函数f(x,l):

其中图1是一个曲顶柱体——三维空间中函数的图像。

自己用板子画得图,比较难看,各位勿怪。如果大家学过高数,肯定就会知道一个概念叫做“偏导数”。这里的操作方法和它是类似的,即认为第三个变量固定(取截面),而研究另外两个变量之间的关系。

插一句题外话,这也是为什么分辨率测量要同时测水平分辨率和垂直分辨率才有意义的原因。因为一般情况下f(x,l)和f(y,l)具有不相同的特性。

一旦能够理解图像可以采用和波形声音相同的研究方法,很快,你就会发现找到新世界大门的感觉。

所以,我们就从声音开始,一起去探寻这个新世界的秘密。

 

 

第二章 工科男与萌妹子

最常见的携带规律信息的声音信号应该就是音乐了。那么,你眼中的音乐,是什么样子的呢?

如果你是一个工科男,或者做音频处理的人,应该会告诉我,我眼中的音乐,是这个样子的:

这是工科男们对音乐的理解——一段随着时间而变化的振动。

但是,如果去问一个学乐器的萌妹子,它给出的答案一定是这样:

这是巴赫Partita No.3小提琴谱中的前几个小节。

而上面那个波形声音,就是把这段曲子演奏出来,通过麦克风采样之后,打出来的波形。

因此我们就有了一个很显然,但是又细思恐极的结论:

上面的两张图片,表示的是同一件东西。

实际上,上面两种方式就是信号的两种不同表示方法。

第一张图片表达的是信号随时间而变化的规律,我们把这种表示方式叫做时域

而第二张图片表达的是组成这整个信号的所有频率成分(如果你初中物理不是体育老师教的,那你应当明白不同的音高对应的是发声体不同的振动频率)。这种表示方式我们把它叫做频域,这张乐谱在信号学上有另一个名字,这个名字还经常被用于各种保健品宣传当中,叫做频谱。

所以实质上频域这个概念对大家来说并不算陌生,只是大家没有注意到而已。

声音的频率好理解,就是发声体每秒振动的次数(次/秒,或者叫Hz),那么,类比到图像当中,频率的概念又是什么呢?

如果你经常关注摄影器材评测的分辨率部分,应当见过一个神奇的单位,叫做线对每毫米(lp/mm)。

空间中从左往右数一共遍历了多少线对,再算一算走过了多少毫米,两者相除得到的就是线对每毫米

时域中从前往后看一共振动了多少次,再算一算振动了多少秒,两者相除得到的就是次每秒

两者完全一样

也就是说,只要你能理解赫兹作为频率单位的概念,就同样不难理解,图像的基础分辨率单位lp/mm,其实也是一个频率单位。

这里的频率我们把它叫做空间频率(Spatial Frequencies)。

将上面图片中的时域信号转变成下面图片中的频域信号,需要用的数学工具很多人应该都听说过,叫做傅里叶变换(Fourier Transform)。

在声音当中,傅里叶同学告诉我们,任何周期函数,都可以看作是不同振幅,不同相位正弦波的叠加。在声音里我们可以理解为,利用对不同琴键不同时间点的敲击,可以组合出任何一首乐曲。

以下图中的方波为例:

第一幅图是一个郁闷的正弦波cos(t)

第二幅图是2个卖萌的正弦波的叠加cos(t)+cos(3t)

第三幅图是4个发春的正弦波的叠加

第四幅图是10个便秘的正弦波的叠加

随着正弦波数量逐渐的增长,他们最终会叠加成一个标准的矩形,大家从中体会到了什么道理?

(只要努力,弯的都能掰直!)

图像当中其实也一样。利用不同频率的“图像元”在空间中不同位置放置,可以叠加生成任意一张图像。

很多玄学党会提到“微反差”这个概念,但如果能接受图像是以1lp/mm、2lp/mm……这种频率成分叠加起来而生成的话,这个概念也就不再玄学了。由于不同光学系统在不同频率下其特性不同,而人眼又是对频域敏感(其实人耳也是,你听音乐时候听的不是时域波形,而是频域音高),所以不同的光学系统确实是有“味道”上的微小差异,而且是可以量化测量的。这种测量方法我们把它叫做空间频率响应(Spatial Frenquencies Response,SFR)。以往的分辨率测试实际上只针对了高频部分的响应特性,在我看来,中低频的特性对于一张照片观感影响其实更加大——大家都在LR或者ACR里调整过对比度/清晰度的吧?跟锐化相比是不是对整张照片的影响更大?

(未完待续)

 

评论

暂无评论,快来添加评论哦