-
tesseract ocr 中文版
v4.0.0 官方版 -
- 軟件大。41.9M
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件 / 文字處理
- 軟件授權(quán):免費(fèi)軟件
- 更新時(shí)間:2018-04-19 13:52
- 軟件等級:
- 應(yīng)用平臺:WinXP, Win7, Win8, Win10
- 軟件官網(wǎng):暫無
相關(guān)軟件
tesseract ocr 中文包v3.04 最新版
17.1M/中文/5.0
夕風(fēng)OCR圖片轉(zhuǎn)文本識別工具v2.0 綠色版
611KB/中文/5.0
漢王OCR漢字表格識別系統(tǒng)v5.0 專業(yè)聯(lián)想增強(qiáng)
30.5M/中文/4.0
漢王OCR文字識別軟件v6.0 中文破解版
45.5M/中文/10.0
尚書7號ocr文字識別系統(tǒng)完全版中文破解版
43.4M/中文/10.0
軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評論下載地址
-
tesseract-ocr是一款ocr文字識別軟件,能夠快速將圖片文字進(jìn)行識別提取,從轉(zhuǎn)換成電子文檔,tesseract ocr windows常適用于印刷行業(yè);另外國內(nèi)多種包含ocr技術(shù)的軟件,例如清華文通、漢王等也都是非常不錯(cuò)的。有需要的朋友歡迎來IT貓撲下載吧。
tesseract ocr中文版平臺支持
Tesseract可以在Linux,Windows(用VC++Express或CygWin)和Mac OSX上運(yùn)行。它也可以在其他平臺上編譯,包括Android和iPhone,雖然這些都不是行之有效的平臺。其他項(xiàng)目也可以用插件頁面在各種平臺上使用Tesseract。
tesseract ocr安裝說明
下載完后進(jìn)行安裝,默認(rèn)情況下安裝程序會給你配置系統(tǒng)環(huán)境變量,以指向安裝目錄(之后可以通過DOS界面在任意目錄運(yùn)行tesseract)。
tessdata 目錄存放的是語言字庫文件,和在命令行界面中可能用到的參數(shù)所對應(yīng)的文件. 這個(gè)安裝程序默認(rèn)包含了英文字庫。
使用Tessract-OCR引擎識別驗(yàn)證碼
打開DOS界面,輸入tesseract:
如果出現(xiàn)如上輸出,表示安裝正常。
我準(zhǔn)備了一張驗(yàn)證碼code.jpg放在D盤根目錄下
附錄:
Usage:tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
pagesegmode values are:
0 = Orientation and script detection (OSD) only.
1 = Automatic page segmentation with OSD.
2 = Automatic page segmentation, but no OSD, or OCR
3 = Fully automatic page segmentation, but no OSD. (Default)
4 = Assume a single column of text of variable sizes.
5 = Assume a single uniform block of vertically aligned text.
6 = Assume a single uniform block of text.
7 = Treat the image as a single text line.
8 = Treat the image as a single word.
9 = Treat the image as a single word in a circle.
10 = Treat the image as a single character.
-l lang and/or -psm pagesegmode must occur before anyconfigfile.
tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
tesseract 圖片名 輸出文件名 -l 字庫文件 -psm pagesegmode 配置文件
例如:
tesseract code.jpg result -l chi_sim -psm 7 nobatch
-l chi_sim 表示用簡體中文字庫(需要下載中文字庫文件,解壓后,存放到tessdata目錄下去,字庫文件擴(kuò)展名為 .raineddata 簡體中文字庫文件名為: chi_sim.traineddata)
-psm 7 表示告訴tesseract code.jpg圖片是一行文本 這個(gè)參數(shù)可以減少識別錯(cuò)誤率. 默認(rèn)為 3
configfile 參數(shù)值為tessdata\configs 和 tessdata\tessconfigs 目錄下的文件名
核心開發(fā)
核心開發(fā)人員是Ray Smith。
在相關(guān)工作中,Thomas Breuel(tmbdev)和Ilya Mezhirov (mezhirov)開發(fā)了OCRopus項(xiàng)目,該項(xiàng)目還提供了布局分析和統(tǒng)計(jì)語言建模的工作。
Tesseract的大部分運(yùn)作由谷歌贊助。
-
更多>>軟件截圖
推薦軟件
winhex中文版(多功能十六進(jìn)制編輯器) 2.3M
下載/多國語言[中文]/2v20.4 SR-5 中文專業(yè)綠色版emeditor32位+64位專業(yè)版 35M
下載/中文/1v20.9.1 最新破解版EmEditor pro專業(yè)版 5.0M
下載/中文/1v20.2.1 32Bit 漢化綠色便攜版極速pdf編輯器去水印 41.5M
下載/中文/21v2.0.1.1 中文免費(fèi)版CoCo圖像轉(zhuǎn)換成word文字識別工具 57.0M
下載/中文/4綠色特別版網(wǎng)頁代碼字符批量替換工具 16KB
下載/中文/1多行文本批量替換工具 127KB
下載/中文/1綠色免費(fèi)版黑馬校對v15完整破解版(專業(yè)文字校對) 6.0M
下載/中文/1v15 破解版
其他版本下載
精品推薦ocr文字識別軟件
- 更多 (234個(gè)) >>ocr文字識別軟件在工作中和生活中使用電腦的的時(shí)間是非常頻繁的,很多情況下用電腦處理文字也是非常需要時(shí)間的一個(gè)工作。為了能夠讓您在對這些數(shù)據(jù)的編輯處理時(shí),節(jié)省更多的時(shí)間是非常適合使用這些軟件的。不管您是出于什么行業(yè)都是
圖片轉(zhuǎn)文字ocr24.5M
/中文/0CoCo圖像轉(zhuǎn)換成word文字識別工具57.0M
/中文/4coco截圖轉(zhuǎn)文字識別器57.0M
/中文/1漢王OCR漢字表格識別系統(tǒng)30.5M
/中文/2尚書7號ocr文字識別系統(tǒng)完全版43.4M
/中文/4金鳴表格文字識別大師113.3M
/中文/0免費(fèi)掃描全能王32.7M
/中文/0天若文字識別專業(yè)版56.2M
/中文/6旋風(fēng)圖文識別軟件3.2M
/中文/0迅捷文字識別免費(fèi)版97.3M
/中文/1
相關(guān)文章
-
下載地址
-
tesseract ocr 中文版 v4.0.0 官方版
-
-
查看所有評論>>網(wǎng)友評論
-
更多>>猜你喜歡