CuneiForm

CuneiForm

CuneiForm(OpenOCR)是用于打印模板的文本识别软件。手稿或PDF文件,但是程序无法识别表格结构。
CuneiForm(OpenOCR)是用于打印模板的文本识别软件。手稿或PDF文件,但是程序无法识别表格结构。语言模型适用于20种语言,结果可以用作HTML,RTF或ASCII文本进行保存,或直接导出到Word或Excel。这些字体是,并且文档的结构不变。CuneiForm直到最近才制作了一个开源软件。它是由俄罗斯公司Cognitive Technologies开发的,意为类似楔形文字(源自英语cuneiform =楔形)。...仅从2008年4月起,由于源代码仅在2008年才可用,因此才有可能进行商业使用。Jussi Pakkanen提供了CuneiForm的可移植版本。操作系统:Linux,BSD,Mac OS X和Windows。支持20种语言:英语,德语,法语,西班牙语,意大利语,葡萄牙语,荷兰语,俄语,俄语-英语混合语,乌克兰语,丹麦语,瑞典语,芬兰语,塞尔维亚语,克罗地亚语,波兰语等。
cuneiform

分类目录

Linux版CuneiForm的替代品

Tesseract

Tesseract

Tesseract.js是一个JavaScript库,可从图像中获取几乎任何语言的单词。
GImageReader

GImageReader

gImageReader是Tesseract OCR引擎的简单Gtk / Qt前端。功能:-从磁盘,扫描设备,剪贴板和屏幕截图导入PDF文档和图像
CopyFish

CopyFish

在任何网站上从图像/视频/ PDF中提取和翻译文本。
OCRFeeder

OCRFeeder

OCRFeeder是文档布局分析和光学字符识别系统。
Libcaca

Libcaca

libcaca是一个图形库,它输出文本而不是像素,因此可以在较旧的视频卡或文本终端上使用。
Treegonizer

Treegonizer

将所有内容紧密集成到DocOne和FileOne中的单个用户界面中。无需弄乱多个窗口和程序。大量的Notes和复杂的结构,DocOne和FileOne都非常快。