神经网络图像识别算法依赖于数据集的质量——对模型进行训练和测试。下面是一些制作图像数据的重要参数和注意事项。
1、图像尺寸——高质量的图像提供了更多的模型信息,但是需要更多的神经网络节点和更强的计算能力。
2、图片数量——你给模型提供的数据越多,它就会越精确,但是要保证这个训练集代表了真实的人口。
3、通道数-灰度图像有2个通道(黑白),彩色图像通常有3个颜色通道(红色、绿色、蓝色/RGB),颜色显示为[0,255]。
4、高宽比-确保图像的高宽比和尺寸相同。典型的神经网络模型采用正方形输入图像。
5、图像缩放-一旦所有图像的平方处理后,每一个图像都可以缩放。还有很多放大和缩小技术,可以在深度学习库中用作函数。
6、输入数据的均值,标准差——在所有训练例子中,可以查看“均值图像”,通过计算每个像素的平均值来获得关于图像基础设施的信息。
7、标准化图像输入——确保(在本例中为像素)所有输入参数都是均匀的数据分布。通过网络培训,可以加快融合的速度。通过从每个像素减去平均值,然后将结果除以标准差,就可以使数据标准化。
8、降维-可以决定将RGB通道折叠成灰度通道。若要使神经网络对其大小不变,或使计算强度降低,那么可能需要减小其它尺寸。
9、数据扩展-涉及对当前图像的类型进行扩展(包括缩放和旋转),对现有数据集进行扩展。这就是为了让神经网络有许多不同的变化。因此,神经网络很难在数据集中识别有害特征。