介绍深度学习技术普遍用于非结构化数据,例如文本数据或图像数据。在处理任何类型的数据之前,应先对它有充分的了解。因此,在本文中,我们将讨论图像并查看它们如何实际存储在计算机上。我们将介绍两种保存图像的流行格式-灰度和RGB格式。直接开始吧!黑白或灰度图像如何存储在计算机中?让我们举个例子。在这里,我们已经采取了黑白图像,也被称为一个 灰度图像。

 

 

这是数字8的图像。现在,如果我们进一步放大并且仔细观察,你会发现图像变得失真,并且你会在该图像上看到一些小方框。

 

 

这些小方框叫做Pixels。我们经常使用的图像维度是X x Y。这实际上是什么意思?这意味着图像的尺寸就是图像的高度(x)和宽度(y)上的像素数。在这种情况下,高度为24像素,宽度为16像素。因此,此图像的尺寸将为24 x 16。尽管我们看到的是这种格式的图像,但计算机以数字的形式存储图像

 

 

这些像素中的每一个都表示为数值,而这些数字称为像素值。这些像素值表示像素的强度。对于灰度或黑白图像,我们的像素值范围是0到255。接近零的较小数字表示较深的阴影,而接近255的较大数字表示较浅或白色的阴影。因此,计算机中的每个图像都以这种形式保存,其中你具有一个数字矩阵,该矩阵也称为Channel

 

 

现在你能猜出这个矩阵的形状吗?好吧,它将与图像的高度和宽度上的像素值数量相同。在这种情况下,矩阵的形状将为24 x 16现在,让我们快速总结一下到目前为止我们已经学到的要点-图像以数字矩阵的形式存储在计算机中,其中这些数字称为像素值。这些像素值代表每个像素的强度。0代表黑色,255代表白色。数字矩阵称为通道,对于灰度图像,我们只有一个通道。彩色图像如何存储在计算机上?现在我们有了关于如何将灰度图像存储在计算机中的想法,让我们看一个彩色图像的示例。让我们以彩色图像为例,这是一条狗的图像,

 

 

该图像由许多颜色组成,几乎所有颜色都可以从三种原色(**红色,绿色和蓝色)生成。**我们可以说每个彩色图像都是由这三种颜色或3个通道(红色,绿色和蓝色)

 

 

这意味着在彩色图像中,矩阵的数量或通道的数量将会更多。在此特定示例中,我们有3个矩阵:1个用于红色的矩阵,称为红色通道

 

 

另一个绿色的称为绿色通道

 

 

最后是蓝色的矩阵,也称为蓝色通道。

 

 

这些像素都具有从0到255的值,其中每个数字代表像素的强度,或者你可以说红色,绿色和蓝色的阴影。最后,所有这些通道或所有这些矩阵都将叠加在一起,这样,当图像的形状加载到计算机中时,它会是

 

 

其中N是整个高度上的像素数,M是整个宽度上的像素数,3表示通道数,在这种情况下,我们有3个通道R,G和B。在我们的示例中,彩色图像的形状将是   **6 x 5 x 3,**因为我们在高度上有6个像素,在宽度上有5个像素,并且存在3个通道。尾注本文介绍了两种最常见的图像格式:灰度和RGB,以及它们如何存储在计算机中。