Tesseract

Tesseract

Tesseract.js是一个JavaScript库,可从图像中获取几乎任何语言的单词。
Tesseract.js是一个JavaScript库,可从图像中获取几乎任何语言的单词。Tesseract OCR发动机是1995年UNLV精度测试中排名前三的发动机之一。在1995年到2006年之间,它几乎没有做任何工作,但是它可能是最精确的开放源代码OCR引擎之一。源代码将读取二进制,灰色或彩色图像并输出文本。内置的tiff阅读器可以读取未压缩的TIFF图像,也可以添加libtiff来读取压缩的图像。有许多语言的语言文件,甚至包括Fraktur和blackletter字体中设置的文本。

分类目录

具有开源许可证的Windows版Tesseract的替代方案