tesseract-ocr下載 最新更新|軟件分類|軟件專題|手機(jī)版|論壇轉(zhuǎn)貼|軟件發(fā)布

您當(dāng)前所在位置: 首頁(yè)應(yīng)用軟件文字處理 → tesseract ocr 中文版 v4.0.0 官方版

tesseract ocr 中文版

v4.0.0 官方版

tesseract ocr 中文版下載
  • 軟件大?。?span itemprop="fileSize">41.86 MB
  • 軟件語(yǔ)言:中文
  • 軟件類型:國(guó)產(chǎn)軟件 / 文字處理
  • 軟件授權(quán): 免費(fèi)軟件
  • 更新時(shí)間:2018-04-19 13:52:58
  • 軟件等級(jí):4星
  • 軟件廠商: -
  • 應(yīng)用平臺(tái):WinXP, Win7, Win8, Win10
  • 軟件官網(wǎng):

ITMOP本地下載文件大?。?1.86 MB

點(diǎn)贊 好評(píng) 0%(0) 差評(píng) 差評(píng) 0%(0)

軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評(píng)論下載地址

小編為您推薦: tesseractocr 文字識(shí)別 文字提取

tesseract-ocr是一款ocr文字識(shí)別軟件,能夠快速將圖片文字進(jìn)行識(shí)別提取,從轉(zhuǎn)換成電子文檔,tesseract ocr windows常適用于印刷行業(yè);另外國(guó)內(nèi)多種包含ocr技術(shù)的軟件,例如清華文通、漢王等也都是非常不錯(cuò)的。有需要的朋友歡迎來(lái)IT貓撲下載吧。

tesseract ocr中文版平臺(tái)支持

Tesseract可以在Linux,Windows(用VC++Express或CygWin)和Mac OSX上運(yùn)行。它也可以在其他平臺(tái)上編譯,包括Android和iPhone,雖然這些都不是行之有效的平臺(tái)。其他項(xiàng)目也可以用插件頁(yè)面在各種平臺(tái)上使用Tesseract。

tesseract ocr安裝說(shuō)明

下載完后進(jìn)行安裝,默認(rèn)情況下安裝程序會(huì)給你配置系統(tǒng)環(huán)境變量,以指向安裝目錄(之后可以通過(guò)DOS界面在任意目錄運(yùn)行tesseract)。

tesseract-ocr

tessdata 目錄存放的是語(yǔ)言字庫(kù)文件,和在命令行界面中可能用到的參數(shù)所對(duì)應(yīng)的文件.? 這個(gè)安裝程序默認(rèn)包含了英文字庫(kù)。

使用Tessract-OCR引擎識(shí)別驗(yàn)證碼

打開(kāi)DOS界面,輸入tesseract:

tesseract-ocr中文包

如果出現(xiàn)如上輸出,表示安裝正常。

我準(zhǔn)備了一張驗(yàn)證碼code.jpg放在D盤根目錄下

tesseract-ocr中文版

tesseract ocr下載

附錄:

Usage:tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]

pagesegmode values are:

0 = Orientation and script detection (OSD) only.

1 = Automatic page segmentation with OSD.

2 = Automatic page segmentation, but no OSD, or OCR

3 = Fully automatic page segmentation, but no OSD. (Default)

4 = Assume a single column of text of variable sizes.

5 = Assume a single uniform block of vertically aligned text.

6 = Assume a single uniform block of text.

7 = Treat the image as a single text line.

8 = Treat the image as a single word.

9 = Treat the image as a single word in a circle.

10 = Treat the image as a single character.

-l lang and/or -psm pagesegmode must occur before anyconfigfile.

tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]

tesseract? ? 圖片名? 輸出文件名 -l 字庫(kù)文件 -psm pagesegmode 配置文件

例如:

tesseract code.jpg result? -l chi_sim -psm 7 nobatch

-l chi_sim 表示用簡(jiǎn)體中文字庫(kù)(需要下載中文字庫(kù)文件,解壓后,存放到tessdata目錄下去,字庫(kù)文件擴(kuò)展名為? .raineddata 簡(jiǎn)體中文字庫(kù)文件名為:? chi_sim.traineddata)

-psm 7 表示告訴tesseract code.jpg圖片是一行文本? 這個(gè)參數(shù)可以減少識(shí)別錯(cuò)誤率.? 默認(rèn)為 3

configfile 參數(shù)值為tessdata\configs 和? tessdata\tessconfigs 目錄下的文件名

核心開(kāi)發(fā)

核心開(kāi)發(fā)人員是Ray Smith。

在相關(guān)工作中,Thomas Breuel(tmbdev)和Ilya Mezhirov (mezhirov)開(kāi)發(fā)了OCRopus項(xiàng)目,該項(xiàng)目還提供了布局分析和統(tǒng)計(jì)語(yǔ)言建模的工作。

Tesseract的大部分運(yùn)作由谷歌贊助。

更多>> 軟件截圖

推薦應(yīng)用

其他版本下載

    精品推薦 ocr文字識(shí)別軟件

    ocr文字識(shí)別軟件
    更多 (238個(gè)) >> ocr文字識(shí)別軟件 在工作中和生活中使用電腦的的時(shí)間是非常頻繁的,很多情況下用電腦處理文字也是非常需要時(shí)間的一個(gè)工作。為了能夠讓您在對(duì)這些數(shù)據(jù)的編輯處理時(shí),節(jié)省更多的時(shí)間是非常適合使用這些軟件的。不管您是出于什么行業(yè)都是非常使用的,在這個(gè)任何事情都追求高速快節(jié)奏的時(shí)代,能夠提高辦公效率是非常不錯(cuò)的一

    相關(guān)文章

    下載地址

    • tesseract ocr 中文版 v4.0.0 官方版

    查看所有評(píng)論>> 網(wǎng)友評(píng)論

    發(fā)表評(píng)論

    (您的評(píng)論需要經(jīng)過(guò)審核才能顯示) 網(wǎng)友粉絲QQ群號(hào):374962675

    查看所有 0條 評(píng)論>>

    更多>> 猜你喜歡