标题: 【OCR教程】OCR系列教程三:字库工程应用篇【转自文心阁】 [打印本页]

作者: 天涯凝望    时间: 2011-12-15 19:01
标题: 【OCR教程】OCR系列教程三:字库工程应用篇【转自文心阁】
根据试用者反馈回来的信息,主要有3个关键步骤——

一、设置
  设置成“手写”与“公文”

二、图象预处理
  宽度改成1400不是关键,关键是打开PS,打开需要转换格式的图片,全选,复制,然后新建一个文件(背景白色),黏贴。,然后才调整宽度为1400
  PS:或许会有人问,我用自己的方法处理图片行不行?行是行,不过效果肯定没有这样做的好,因为字库的图是从我处理过的图上抠下来的,所以,要100%的效果,请按上面的步骤做。如果一定要用你自己的方法处理,建议最好自己做个字库囧

三、字库的使用
  将“项目”文件夹放在汉王文本王安装的根目录下,“字库.DKP”可随意存放
  例如:你的汉王安装路径是D:\\Program Files\\HWDOC_KING
  则,字库文件的位置为D:\\Program Files\\HWDOC_KING\\项目\\字库\\字库·图一.jpg
  如果按上述途径不能使用字库,用记事本将“字库.DKP”打开,修改里面的相应路径。
  如果还不能正确使用,那自己重新识别、校对一遍吧囧
  另外,每次打开字库工程,先分别选择字库文件(字库·图一.JPG、字库·图二.JPG、符号一)后,在菜单栏的“识别(R)”的下拉菜单中选择“手写--学习全体字(U)”,每个图要分别操作一遍
  PS:一般一章小说的错误率不会超过3个相同的字,除非是生僻字特多的例外……如果不在这个范围内,请检查下是否正确使用字库了。

怎样才算是字库被正确使用呢?

一、打开工程之后,点字库其中一张图后,会有识别结果自动出动。如果存放路径不正确的话,会灰白一遍的。

二、错误率在2~3个字以内,超过这个范围的,就是没有正确使用字库

特上传经过处理的图,经各位检验
作者: wwwmhk123    时间: 2017-2-17 08:18
原来是这样啊,厉害啊




欢迎光临 (http://ftp.zasq.net/) Powered by Discuz! X3.2