针对数字ocr的识别,特征向量的选取就非常的重要。由于是对ocr和libsvm的尝试,所以我的训练使用的是手写的图片,拖动鼠标,在picturbox控件上画的数字图片,既能训练,也能用来识别。样本数据保存在数据库中,需要识别的时候载入数据库的样本数据训练该分类识别器。
图片选择160*160的大小,特征向量选择:垂直投影,暂时没有经过边缘轮廓提取。简单的把该图片分成16*16网格, 每个网格的特征向量值:黑色的像素点/总的像素点,每个数字样本垂直投影后总共现只有16个特征向量,每个向量也就是垂直网格列的合计。依次顺序为:1,2,3,4…..16 ,为0(也就是空白)的特征向量在训练的时候也没有过滤掉。