300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > tesseract-ocr .NET 识别图片中文字

tesseract-ocr .NET 识别图片中文字

时间:2019-08-28 17:50:25

相关推荐

tesseract-ocr .NET 识别图片中文字

github:http://​/charlesw/tesseract​

例子:/charlesw/tesseract-samples

语言数据文件github:/tesseract-ocr/tessdata

语言数据文件下载:/tesseract-ocr/tessdata/archive/refs/heads/main.zip

使用步骤:

(1).在项目中Nuget包中添加“Tesseract”包。

(2)下载语言数据文件:/tesseract-ocr/tessdata/archive/refs/heads/main.zip

(3)在项目中新建文件夹名称为“tessdata”

(4)在下载的语言数据文件中找到“chi_sim.traineddata”文件,复制到“tessdata”文件夹中,设置“chi_sim.traineddata”“文件复制到输出目录”设置为“始终复制”。

(5)复制如下示例代码到程序中,并指定对应识别图片

示例代码:

using (var engine = new TesseractEngine(Server.MapPath(@"~/tessdata"), "chi_sim", EngineMode.Default))//英文是eng,简体中文是chi_sim{// have to load Pix via a bitmap since Pix doesn't support loading a stream.var path = @"ocr/xx.png";using (var image = new System.Drawing.Bitmap(path)){using (var pix = PixConverter.ToPix(image)){using (var page = engine.Process(pix)){var meanConfidence = String.Format("{0:P}", page.GetMeanConfidence());var resultText = page.GetText();return Content("meanConfidence: " + meanConfidence + ",resultText" + resultText);}}}}

注:tessdata文件夹下的语言数据文件“复制到输出目录”设置为“始终复制”。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。