Tesseract.js是一个JavaScript库,可从图像中获取几乎任何语言的单词。Tesseract OCR发动机是1995年UNLV精度测试中排名前三的发动机之一。在1995年到2006年之间,它几乎没有做任何工作,但是它可能是最精确的开放源代码OCR引擎之一。源代码将读取二进制,灰色或彩色图像并输出文本。内置的tiff阅读器可以读取未压缩的TIFF图像,也可以添加libtiff来读取压缩的图像。有许多语言的语言文件,甚至包括Fraktur和blackletter字体中设置的文本。
分类目录
Windows版Tesseract的替代品
116
ABBYY FineReader
ABBYY FineReader是一种OCR软件,可提供无与伦比的文本识别准确性和转换功能,几乎消除了文档的重新键入和重新设置格式。最多支持190种语言进行文本识别。
35
GImageReader
gImageReader是Tesseract OCR引擎的简单Gtk / Qt前端。功能:-从磁盘,扫描设备,剪贴板和屏幕截图导入PDF文档和图像
11
4
3
Free OCR to Word
免费的OCR to Word是文本识别软件,可以以闪电般的速度执行所有繁琐的重新键入和重新创建工作,您可以在PC或存档上编辑Word文档...
- 免费应用
- Windows
2
2
Microsoft Office Document Imaging
Microsoft Office Document Imaging(MODI)是Microsoft Office应用程序,支持编辑通过Microsoft Office Document Scanning扫描的文档。
- 免费应用
- Windows
1