Mini Ocr 汉字显示字体识别软件 V1.0绿色版

2.69 MB

应用介绍



本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中,出现的汉字显示字体。Ocr的中文含意是光学字符识别。
为什么叫Mini呢?因为现有的识别汉字的商业Ocr软件,动辄二三十兆,而本软件解压后,也不过三兆多,身材比较纤小,再加上本软件主要用于识别字体比较小的汉字,所以叫Mini,中文的发音是“迷你”,中文含义是超小型。
MiniOcr进行汉字识别的策略:
1)采用复合特征的分类方法。
2)字符集选择3755个一级汉字。
3)字体选择最常用的宋体。
4)字号选择从小五号到一号汉字,主要针对20个点之内的小字体。
5)英汉混排时,汉语优先。
6)汉字粘连时,进行动态优化切分。
7)识别前,先进行页面切分,把页面分割成一个一个的文字段落,擦除图形块,保留文字块。按照文字块先后顺序进行识别,以期处理图文混排的页面时,能达到更好的识别效果,并排除图形的干扰,加快文字的识别速度。

评论内容(0)

你可能还喜欢

计算机等级考试辅导软件(二级C) V1.1

FastNet99 V4.3

Lynx V2.8.5 Dev 8

ActivePerl V5.8.7.815 for Linux

IRCPlus V2.5 (SP5) Build 1326

影子剧场(YZ movie) V1.1

短信息.NET

CDRWin V4.0B 汉化版

关闭