tesseract-ocr下載 最新更新|軟件分類|軟件專題|手機(jī)版|論壇轉(zhuǎn)貼|軟件發(fā)布

您當(dāng)前所在位置:首頁應(yīng)用軟件文字處理 → tesseract ocr 中文版 v4.0.0 官方版

tesseract ocr 中文版

v4.0.0 官方版

tesseract ocr 中文版
  • 軟件大。41.9M
  • 軟件語言:中文
  • 軟件類型:國產(chǎn)軟件 / 文字處理
  • 軟件授權(quán):免費(fèi)軟件
  • 更新時(shí)間:2018-04-19 13:52
  • 軟件等級:4星
  • 應(yīng)用平臺:WinXP, Win7, Win8, Win10
  • 軟件官網(wǎng):

ITMOP本地下載文件大小:41.9M

點(diǎn)贊好評0%(0) 差評差評0%(0)

軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評論下載地址

小編為您推薦:tesseractocr文字識別文字提取

tesseract-ocr是一款ocr文字識別軟件,能夠快速將圖片文字進(jìn)行識別提取,從轉(zhuǎn)換成電子文檔,tesseract ocr windows常適用于印刷行業(yè);另外國內(nèi)多種包含ocr技術(shù)的軟件,例如清華文通、漢王等也都是非常不錯(cuò)的。有需要的朋友歡迎來IT貓撲下載吧。

tesseract ocr中文版平臺支持

Tesseract可以在Linux,Windows(用VC++Express或CygWin)和Mac OSX上運(yùn)行。它也可以在其他平臺上編譯,包括Android和iPhone,雖然這些都不是行之有效的平臺。其他項(xiàng)目也可以用插件頁面在各種平臺上使用Tesseract。

tesseract ocr安裝說明

下載完后進(jìn)行安裝,默認(rèn)情況下安裝程序會給你配置系統(tǒng)環(huán)境變量,以指向安裝目錄(之后可以通過DOS界面在任意目錄運(yùn)行tesseract)。

tesseract-ocr

tessdata 目錄存放的是語言字庫文件,和在命令行界面中可能用到的參數(shù)所對應(yīng)的文件.  這個(gè)安裝程序默認(rèn)包含了英文字庫。

使用Tessract-OCR引擎識別驗(yàn)證碼

打開DOS界面,輸入tesseract:

tesseract-ocr中文包

如果出現(xiàn)如上輸出,表示安裝正常。

我準(zhǔn)備了一張驗(yàn)證碼code.jpg放在D盤根目錄下

tesseract-ocr中文版

tesseract ocr下載

附錄:

Usage:tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]

pagesegmode values are:

0 = Orientation and script detection (OSD) only.

1 = Automatic page segmentation with OSD.

2 = Automatic page segmentation, but no OSD, or OCR

3 = Fully automatic page segmentation, but no OSD. (Default)

4 = Assume a single column of text of variable sizes.

5 = Assume a single uniform block of vertically aligned text.

6 = Assume a single uniform block of text.

7 = Treat the image as a single text line.

8 = Treat the image as a single word.

9 = Treat the image as a single word in a circle.

10 = Treat the image as a single character.

-l lang and/or -psm pagesegmode must occur before anyconfigfile.

tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]

tesseract    圖片名  輸出文件名 -l 字庫文件 -psm pagesegmode 配置文件

例如:

tesseract code.jpg result  -l chi_sim -psm 7 nobatch

-l chi_sim 表示用簡體中文字庫(需要下載中文字庫文件,解壓后,存放到tessdata目錄下去,字庫文件擴(kuò)展名為  .raineddata 簡體中文字庫文件名為:  chi_sim.traineddata)

-psm 7 表示告訴tesseract code.jpg圖片是一行文本  這個(gè)參數(shù)可以減少識別錯(cuò)誤率.  默認(rèn)為 3

configfile 參數(shù)值為tessdata\configs 和  tessdata\tessconfigs 目錄下的文件名

核心開發(fā)

核心開發(fā)人員是Ray Smith。

在相關(guān)工作中,Thomas Breuel(tmbdev)和Ilya Mezhirov (mezhirov)開發(fā)了OCRopus項(xiàng)目,該項(xiàng)目還提供了布局分析和統(tǒng)計(jì)語言建模的工作。

Tesseract的大部分運(yùn)作由谷歌贊助。

更多>>軟件截圖

推薦軟件

其他版本下載

    精品推薦ocr文字識別軟件

    ocr文字識別軟件
    更多 (234個(gè)) >>ocr文字識別軟件在工作中和生活中使用電腦的的時(shí)間是非常頻繁的,很多情況下用電腦處理文字也是非常需要時(shí)間的一個(gè)工作。為了能夠讓您在對這些數(shù)據(jù)的編輯處理時(shí),節(jié)省更多的時(shí)間是非常適合使用這些軟件的。不管您是出于什么行業(yè)都是

    相關(guān)文章

    下載地址

    • tesseract ocr 中文版 v4.0.0 官方版

    查看所有評論>>網(wǎng)友評論

    發(fā)表評論

    (您的評論需要經(jīng)過審核才能顯示) 網(wǎng)友粉絲QQ群號:203046401

    查看所有0條評論>>

    更多>>猜你喜歡