扫一扫分享
一个js ocr识别库,支持包括中英文等许多语言的图片和视频文字识别,底层封装了Tesseract OCR引擎来实现。
Tesseract.js 网站上所说,它支持 100 多种语言,自动文本定位和脚本检测,用于阅读段落、单词和字符边界框的简单界面。该库支持60多种语言, 自动文本定向和脚本检测, 用于读取段落, 单词和字符边界框的简单界面。 Tesseract.js可以在具有NodeJS的浏览器和服务器上运行, 这使其可以在许多平台上使用。
Tesseract 的最新版本第 4 版于 2018 年 10 月发布,它包含一个新的 OCR 引擎,该引擎使用基于长短期记忆(LSTM) 的神经网络系统,旨在产生更准确的结果。
示例:
Tesseract.recognize(myImage) .progress(function (p) { console.log('progress', p) }) .then(function (result) { console.log('result', result) })
手机预览