关于图片里的文本识别,哪些特征相对有效( 二 )


所以标注样本的丰富性也直接影响到模型的聪明程度,网易易盾在19年对网易内部产品提供反垃圾服务的过程中,积累了大量色情样本数据,这使得我们的标注数据非常全面,有效训练更优机器模型。

■网友
我正好在做钱币冠字号的识别,我感觉单纯的像素特征加上softmax就能达到很好的效果哦了。用HOG效果更好,shape context 和HOG相似,如果还不够用的话可以加上投影直方图。另外,如果对应用平台没有限制的话,卷及神经网络,稀疏自编码应该更好。我是凭感觉说的,真希望有内行的人能全面的解答一下。在不同的平台下,不同的应用,应该怎么选择特征,有哪些原则可以遵循。


推荐阅读