本词条缺少概述、名片图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!
- 中文名
- 金软PDF文本抽出
- 公司开发
- 北京信久通科技有限公司
- 功 能
- 同时为多个PDF文件抽出文本
- 版 本
- PDF 1.2
程序支持的PDF版本:
PDF 1.0
PDF 1.1
PDF 1.2
PDF 1.3
PDF 1.4
PDF 1.5
PDF 1.6
PDF 1.7
可以从上述文件的各种编码字符集数据中抽取文本。
程序支持的可转换的字符集:
EUC-JP
EUC-JP-FIX
ISO-10646-UCS-2
ISO-10646-UCS-4
ISO-2022-JP
ISO-8859-1
Shift_JIS
UTF-16
UTF-8、WINDOWS31J
ChineseGBK
ChineseBIG5
GB18030
KoreanKSC
Shift_JIS-2004
ISO-2022-JP-2004
EUC-JIS-2004
程序支持的可抽出的字符串:
Unicode字符集
日语
英语(只限于拉丁字母字符集ISO_8859-1)
汉语(简体字 GB18030、GBK、繁体字Big5)
韩语(KS_C_5601_1987)的字符串
使用上述语言外的字体时,无法保证抽出结果的正确性。
抽出后的文本有17种字符编码集可供选择。抽出后文本的编码方式所使用的基本字符集中所没有的字符,转换为类似的字符(1个字符或1个字符的组合)。当没有类似的字符时替换为"〓"(2个字节)、"?" (1个字节)。
无法从有密码保护的文件中抽出文本。有密码保护的文件必须事先在源程序中解除安全设置。
金软PDF文本抽出工具还具有快速、稳定、安全的特点,其操作方便,简单;界面清爽,灵动。它是PDF的一个辅助软件,其操作方便简单。
功能介绍:
支持17种常见可转换字符集
支持5中常见的语言
支持在输出文件名末尾加文件生成日期后缀
支持批量处理,操作简便,节省时间
金软PDF文本抽出主界面 |
北京信久通科技有限公司将致力于该软件的进一步开发与研究,不断的提高软件质量,完善软件功能,希望广大用户提出宝贵意见。
- 参考资料
-
- 1. 金软PDF文本抽出 .2345软件大全[引用日期2013-05-27]
词条标签: