Tesseract

71

Tesseract

Tesseract.js是一个JavaScript库，可从图像中获取几乎任何语言的单词。

免费应用
Windows
Mac
Linux

Tesseract.js是一个JavaScript库，可从图像中获取几乎任何语言的单词。Tesseract OCR发动机是1995年UNLV精度测试中排名前三的发动机之一。在1995年到2006年之间，它几乎没有做任何工作，但是它可能是最精确的开放源代码OCR引擎之一。源代码将读取二进制，灰色或彩色图像并输出文本。内置的tiff阅读器可以读取未压缩的TIFF图像，也可以添加libtiff来读取压缩的图像。有许多语言的语言文件，甚至包括Fraktur和blackletter字体中设置的文本。

网站:

https://github.com/tesseract-ocr/tesseract

特征

分类目录

办公与生产力

Linux版Tesseract的替代品

GImageReader

35

GImageReader

gImageReader是Tesseract OCR引擎的简单Gtk / Qt前端。功能：-从磁盘，扫描设备，剪贴板和屏幕截图导入PDF文档和图像

免费应用
Windows
Linux

CuneiForm

9

CuneiForm

CuneiForm（OpenOCR）是用于打印模板的文本识别软件。手稿或PDF文件，但是程序无法识别表格结构。

免费应用
Windows
Mac
Linux

CopyFish

8

CopyFish

在任何网站上从图像/视频/ PDF中提取和翻译文本。

免费应用
Chrome
Windows
Mac
Linux
Firefox

OCRFeeder

6

OCRFeeder

OCRFeeder是文档布局分析和光学字符识别系统。

免费应用
Linux

GOCR

5

GOCR

GOCR是根据GNU公共许可证开发的OCR（光学字符识别）程序。它将扫描的文本图像转换回文本文件。

免费应用
Windows
Linux

OCRopus

5

OCRopus

OCRopus（tm）是最新的文档分析和OCR系统，具有可插拔布局分析，可插拔字符识别，统计自然语言建模...

免费应用
Linux

VietOCR

4

VietOCR

Tesseract OCR引擎的Java / .NET GUI前端。支持越南语的光学字符识别。

免费应用
Windows
Mac
Linux

OCRmyPDF

4

OCRmyPDF

OCRmyPDF将OCR文本层添加到扫描的PDF文件中，从而可以对其进行搜索或复制粘贴。

免费应用
Mac
Linux

WatchOCR

3

WatchOCR

WatchOCR是一个开放源代码OCR服务器，它可以从监视文件夹中的图像创建可搜索的pdf。

免费应用
Linux

YAGF

2

YAGF

YAGF，又是CuneiForm的另一个图形前端，是用于...的图形界面。

免费应用
Linux