Tesseract.js是一个JavaScript库,可从图像中获取几乎任何语言的单词。Tesseract OCR发动机是1995年UNLV精度测试中排名前三的发动机之一。在1995年到2006年之间,它几乎没有做任何工作,但是它可能是最精确的开放源代码OCR引擎之一。源代码将读取二进制,灰色或彩色图像并输出文本。内置的tiff阅读器可以读取未压缩的TIFF图像,也可以添加libtiff来读取压缩的图像。有许多语言的语言文件,甚至包括Fraktur和blackletter字体中设置的文本。
tesseract
分类目录
具有商业许可证的Web版Tesseract的替代方案
116
ABBYY FineReader
ABBYY FineReader是一种OCR软件,可提供无与伦比的文本识别准确性和转换功能,几乎消除了文档的重新键入和重新设置格式。最多支持190种语言进行文本识别。
2