Tesseract

Tesseract

Tesseract.js是一个JavaScript库,可从图像中获取几乎任何语言的单词。
Tesseract.js是一个JavaScript库,可从图像中获取几乎任何语言的单词。Tesseract OCR发动机是1995年UNLV精度测试中排名前三的发动机之一。在1995年到2006年之间,它几乎没有做任何工作,但是它可能是最精确的开放源代码OCR引擎之一。源代码将读取二进制,灰色或彩色图像并输出文本。内置的tiff阅读器可以读取未压缩的TIFF图像,也可以添加libtiff来读取压缩的图像。有许多语言的语言文件,甚至包括Fraktur和blackletter字体中设置的文本。
tesseract

分类目录

Linux版Tesseract的替代品

GImageReader

GImageReader

gImageReader是Tesseract OCR引擎的简单Gtk / Qt前端。功能:-从磁盘,扫描设备,剪贴板和屏幕截图导入PDF文档和图像
CuneiForm

CuneiForm

CuneiForm(OpenOCR)是用于打印模板的文本识别软件。手稿或PDF文件,但是程序无法识别表格结构。
CopyFish

CopyFish

在任何网站上从图像/视频/ PDF中提取和翻译文本。
OCRFeeder

OCRFeeder

OCRFeeder是文档布局分析和光学字符识别系统。
GOCR

GOCR

GOCR是根据GNU公共许可证开发的OCR(光学字符识别)程序。它将扫描的文本图像转换回文本文件。
OCRopus

OCRopus

OCRopus(tm)是最新的文档分析和OCR系统,具有可插拔布局分析,可插拔字符识别,统计自然语言建模...
VietOCR

VietOCR

Tesseract OCR引擎的Java / .NET GUI前端。支持越南语的光学字符识别。
OCRmyPDF

OCRmyPDF

OCRmyPDF将OCR文本层添加到扫描的PDF文件中,从而可以对其进行搜索或复制粘贴。
WatchOCR

WatchOCR

WatchOCR是一个开放源代码OCR服务器,它可以从监视文件夹中的图像创建可搜索的pdf。
YAGF

YAGF

YAGF,又是CuneiForm的另一个图形前端,是用于...的图形界面。