找回密码
 立即注册
搜索
查看: 19366|回复: 1
打印 上一主题 下一主题
收起左侧

[教程] 【OCR教程】OCR系列教程三:字库工程应用篇【转自文心阁】

[复制链接]
天涯凝望 该用户已被删除
跳转到指定楼层
#
发表于 2011-12-15 19:01 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
根据试用者反馈回来的信息,主要有3个关键步骤——

一、设置
  设置成“手写”与“公文”

二、图象预处理
  宽度改成1400不是关键,关键是打开PS,打开需要转换格式的图片,全选,复制,然后新建一个文件(背景白色),黏贴。,然后才调整宽度为1400
  PS:或许会有人问,我用自己的方法处理图片行不行?行是行,不过效果肯定没有这样做的好,因为字库的图是从我处理过的图上抠下来的,所以,要100%的效果,请按上面的步骤做。如果一定要用你自己的方法处理,建议最好自己做个字库囧

三、字库的使用
  将“项目”文件夹放在汉王文本王安装的根目录下,“字库.DKP”可随意存放
  例如:你的汉王安装路径是D:\\Program Files\\HWDOC_KING
  则,字库文件的位置为D:\\Program Files\\HWDOC_KING\\项目\\字库\\字库·图一.jpg
  如果按上述途径不能使用字库,用记事本将“字库.DKP”打开,修改里面的相应路径。
  如果还不能正确使用,那自己重新识别、校对一遍吧囧
  另外,每次打开字库工程,先分别选择字库文件(字库·图一.JPG、字库·图二.JPG、符号一)后,在菜单栏的“识别(R)”的下拉菜单中选择“手写--学习全体字(U)”,每个图要分别操作一遍
  PS:一般一章小说的错误率不会超过3个相同的字,除非是生僻字特多的例外……如果不在这个范围内,请检查下是否正确使用字库了。

怎样才算是字库被正确使用呢?

一、打开工程之后,点字库其中一张图后,会有识别结果自动出动。如果存放路径不正确的话,会灰白一遍的。

二、错误率在2~3个字以内,超过这个范围的,就是没有正确使用字库

特上传经过处理的图,经各位检验
插件设计:zasq.net

玄铁会员 - 等级≥主簿

楼主
发表于 2017-2-17 08:18 | 只看该作者
原来是这样啊,厉害啊
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋| ( Q群816270601 )

GMT+8, 2024-11-24 05:36 , Processed in 1.721297 second(s), 49 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表