pdfOCR-Tesseract4

pdfOCR-Tesseract4 is an iText 7 add-on for Java to recognize and extract text in scanned documents and images. It can also convert them into fully ISO-compliant PDF or PDF/A-3u files that are accessible, searchable, and suitable for archiving

Лицензия

Лицензия

Категории

Категории

iText Прикладные библиотеки Documents Processing PDF Данные iText
Группа

Группа

com.itextpdf
Идентификатор

Идентификатор

pdfocr-tesseract4
Последняя версия

Последняя версия

2.0.1
Дата

Дата

Тип

Тип

pom.sha512
Описание

Описание

pdfOCR-Tesseract4
pdfOCR-Tesseract4 is an iText 7 add-on for Java to recognize and extract text in scanned documents and images. It can also convert them into fully ISO-compliant PDF or PDF/A-3u files that are accessible, searchable, and suitable for archiving
Организация-разработчик

Организация-разработчик

iText Group NV

Скачать pdfocr-tesseract4

Зависимости

compile (4)

Идентификатор библиотеки Тип Версия
com.itextpdf : pdfocr-api jar 2.0.1
com.itextpdf : styled-xml-parser jar 7.2.1
net.sourceforge.tess4j : tess4j jar 4.5.5
org.slf4j : slf4j-api jar 1.7.31

test (4)

Идентификатор библиотеки Тип Версия
com.itextpdf : pdftest jar 7.2.1
ch.qos.logback : logback-classic jar 1.2.4
junit : junit jar 4.13.2
pl.pragmatists : JUnitParams jar 1.0.4

Модули Проекта

Данный проект не имеет модулей.

Версии библиотеки

Версия
2.0.1
2.0.0
1.0.3
1.0.2
1.0.1
1.0.0