Как да инсталирате Tesseract на Windows

Kak Da Instalirate Tesseract Na Windows



Tesseract е свободно достъпен инструмент за разпознаване на текст с отворен код, известен още като OCR (оптично разпознаване на символи). Използва се предимно за идентифициране и извличане на текст от изображения. Той ще прочете текст от данни за изображение и ще запише изход в нов .txt файл. Tesseract също работи под Python, тъй като се използва главно за разпознаване на ръкопис от изображения. Той използва модела LSTR (дългосрочна памет). Tesseract работи под лиценз Apache 2.0.

Ще разработим подробно метода за инсталиране на Tesseract на Windows в този блог.







И така, да започваме!



Как да инсталирам Tesseract на Windows?

Tesseract е инструмент за команден ред, който се използва за извличане на текст от изображения. За да инсталирате Tesseract на Windows, трябва да следвате дадените по-долу инструкции.



Стъпка 1: Изтеглете Tesseract Installer





Първо отидете на предоставената по-долу връзка и изтеглете инсталатора на Tesseract според спецификацията на вашата система:

https: // github.com / UB-Манхайм / тесеракт / седмица



Стъпка 2: Стартирайте Tesseract Installer

Посетете ' Изтегляния ” директория, където се изтегля инсталационната програма на Tesseract. За да инсталирате Tesseract в Windows, изпълнете инсталатора на Tesseract, като щракнете два пъти върху него:

Стъпка 3: Изберете език

Много езици се поддържат от инсталатора на Tesseract. За да взаимодействате с потребителския интерфейс на инсталатора, изберете „ Английски ” като ваш език и щракнете върху „ Добре ”:

Стъпка 4: Инсталирайте Tesseract

След като направите това, съветникът за настройка на Tesseract OCR ще се появи на екрана. За да започнете инсталирането на Tesseract, натиснете „ Следващия ” бутон:

За да приемете „ Лицензионно споразумение “, щракнете върху „ Съгласен съм ” бутон:

Изберете „ Инсталиране за всеки, който използва този компютър ” и натиснете „ Следващия ” бутон:

Ако искате да добавите данни за скрипт или да включите друг език, поставете отметка в съответните квадратчета и натиснете „ Следващия ” бутон. Тъй като не искаме допълнителен скрипт за данни или език, ще продължим с избраните по подразбиране опции:

Изберете мястото за инсталиране и щракнете върху „ Следващия ” бутон:

Ако не искате да създадете пряк път в менюто 'Старт', маркирайте ' Не създавайте преки пътища ” и натиснете „ Инсталирай ” бутон:

След това инсталацията на Tesseract ще бъде стартирана. Изчакайте, докато инсталацията завърши и натиснете „ Следващия ” бутон:

Накрая щракнете върху „ завършек ” бутон:

Стъпка 5: Задайте променлива на средата

След инсталирането трябва да зададете променливата на средата на Tesseract. За да направите това, първо посетете директорията, където сте инсталирали Tesseract и копирайте пътя от „ Адрес ” лента:

Направете търсене за „ Променливи на средата ' в ' Стартиране ” меню и отворете ” Редактирайте променливите на системната среда ”:

В настройките отворете „ Разширено ” меню за настройка и щракнете върху „ Променливи на средата ” бутон:

Избери ' Пътека ” Променлива от „ Системни променливи ” панел и натиснете „ редактиране ” бутон:

След това ' Редактиране на променливата на средата ” ще се появи прозорец на екрана. Натисни ' Нов ” и поставете тук копирания път на инсталационната директория на Tesseract. Накрая щракнете върху „ Добре ” бутон:

Стъпка 6: Проверете инсталацията на Tesseract

За да проверите инсталацията на Tesseract, отворете командния ред на Windows, като потърсите „ Командния ред ' в ' Стартиране ' меню:

Проверете версията на Tesseract, като използвате предоставената команда:

> тесеракт --версия

Даденият по-долу резултат показва, че успешно сме инсталирали Tesseract версия “ v5.2.0 ” в Windows:

Нека продължим напред, за да проверим как да използвате Tesseract в Windows.

Как да използвам Tesseract в Windows?

Tesseract се използва за четене на ръкопис или извличане на текст от снимки. Да видим как работи:

Стъпка 1: Изберете Изображение

Изберете изображението, от което искате да извлечете текст. Както избрахме ' 1.png ”:

Стъпка 2: Извличане на текст от изображение

След като CMD се отвори. Използвайте „ cd ”, за да промените директорията, в която се съхранява изображението. След това стартирайте „ тесеракт ' и дефинирайте името на файла с изображението, както сме посочили ' 1.png ”. „ Текст ” параметърът показва името на изходния файл:

> cd C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> тесеракт 1 .png 'Текст'

Стъпка 3: Проверете извличането на текст

За да проверите извличането на текст, навигирайте в директорията, където съществува файлът с изображение. Можете да видите, че изходният файл „ Текст ” също се записва тук. Кликнете два пъти върху изходния файл, за да проверите дали тесерактът е извлякъл текста от изображението или не:

Можете да видите, че успешно сме извлекли текста с помощта на инструмента за команден ред Tesseract:

Ние демонстрирахме техниката за инсталиране и използване на Tesseract в Windows.

Заключение

За да инсталирате Tesseract на Windows, е необходимо да изтеглите инсталатора на Tesseract. За тази цел следвайте първата сесия на тази статия. След това задайте променливата на средата Path за използване и достъп до Tesseract от командния ред на Windows. След това изберете файла с изображението и използвайте „ Тесеракт ”, за да разпознаете и извлечете текста от изображението. Тук се научихте да инсталирате, както и да използвате „ Тесеракт “ на прозорците.