Tesseract.js是一个JavaScript库,可从图像中获取几乎任何语言的单词。Tesseract OCR发动机是1995年UNLV精度测试中排名前三的发动机之一。在1995年到2006年之间,它几乎没有做任何工作,但是它可能是最精确的开放源代码OCR引擎之一。源代码将读取二进制,灰色或彩色图像并输出文本。内置的tiff阅读器可以读取未压缩的TIFF图像,也可以添加libtiff来读取压缩的图像。有许多语言的语言文件,甚至包括Fraktur和blackletter字体中设置的文本。
tesseract
分类目录
具有任何许可的所有平台的Tesseract替代品
116
ABBYY FineReader
ABBYY FineReader是一种OCR软件,可提供无与伦比的文本识别准确性和转换功能,几乎消除了文档的重新键入和重新设置格式。最多支持190种语言进行文本识别。
35
GImageReader
gImageReader是Tesseract OCR引擎的简单Gtk / Qt前端。功能:-从磁盘,扫描设备,剪贴板和屏幕截图导入PDF文档和图像
19
(a9t9) Free OCR Software
开源OCR软件和Web服务,可从图像文件和PDF中提取文本。该应用程序可以通过在线OCR Web应用程序,OCR API或易于安装的Windows应用商店应用程序(使用,开源和100%间谍软件)获得。
- 免费应用
- Web
15
12
12
11
5