使用 OCR 技术扫描识别是获取图片上文字的主要方式。Spire.OCR for Java 能够帮助开发者在 Java 项目中快速批量识别并提取图片上的文字,实现高效的文字提取功能。本文将介绍如何使用 Spire.OCR for Java 在 Java 项目中识别并提取图片上的文本。
获取 Spire.OCR for Java
使用 Spire.OCR for Java 扫描识别图片上的文字需要先在 Java 项目中引入 Spire.OCR.jar 以及相关的其他依赖文件。
Spire.OCR.jar 文件可从 Spire.OCR for Java 下载页获取。如果您使用 Maven,可以将以下代码添加到项目的 pom.xml 文件中,从而在应用程序中导入 JAR 文件。
<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.ocr</artifactId>
        <version>2.1.1</version>
    </dependency>
</dependencies>
其他依赖文件请根据您所使用的操作系统选择下载:
Linux(须使用 CentOS 8、Ubuntu 18 及以上版本)
安装依赖项
步骤 1、在 IntelliJ IDEA 中创建 Java 项目。

步骤 2、在菜单中的:文件 > 项目结构 > 模块 > 依赖中,添加 Spire.OCR.jar 作为项目依赖。

步骤 3、下载并解压其他依赖文件,将解压出的 dependencies 文件夹中的所有文件复制到项目目录中。

扫描识别本地图像中的文字
- Java
import com.spire.ocr.OcrScanner;
import java.io.*;
public class ScanLocalImage {
    public static void main(String[] args) throws Exception {
        // 指定依赖文件的路径
        String dependencies = "dependencies/";
        // 指定要扫描的图像文件的路径
        String imageFile = "data/Sample.png";
        // 指定输出文件的路径
        String outputFile = "ScanLocalImage_out.txt";
        // 创建一个 OcrScanner 对象
        OcrScanner scanner = new OcrScanner();
        // 设置 OcrScanner 对象的依赖文件路径
        scanner.setDependencies(dependencies);
        // 使用 OcrScanner 对象扫描指定的图像文件
        scanner.scan(imageFile);
        // 获取扫描的文本内容
        String scannedText = scanner.getText().toString();
        // 创建一个输出文件对象
        File output = new File(outputFile);
        // 如果输出文件已经存在,则删除它
        if (output.exists()) {
            output.delete();
        }
        // 创建一个 BufferedWriter 对象用于向输出文件写入内容
        BufferedWriter writer = new BufferedWriter(new FileWriter(outputFile));
        // 将扫描的文本内容写入输出文件中
        writer.write(scannedText);
        // 关闭 BufferedWriter 对象以释放资源
        writer.close();
    }
}指定语言文件扫描识别图像中的文字
- Java
import com.spire.ocr.OcrScanner;
import java.io.*;
public class ScanImageWithLanguageSelection {
    public static void main(String[] args) throws Exception {
        // 指定依赖文件的路径
        String dependencies = "dependencies/";
        // 指定语言文件的路径
        String languageFile = "data/japandata";
        // 指定要扫描的图像文件的路径
        String imageFile = "data/JapaneseSample.png";
        // 指定输出文件的路径
        String outputFile = "ScanImageWithLanguageSelection_out.txt";
        // 创建一个 OcrScanner 对象
        OcrScanner scanner = new OcrScanner();
        // 设置 OcrScanner 对象的依赖文件路径
        scanner.setDependencies(dependencies);
        // 加载指定的语言文件
        scanner.loadLanguageFile(languageFile);
        // 使用 OcrScanner 对象扫描指定的图像文件
        scanner.scan(imageFile);
        // 获取扫描的文本内容
        String scannedText = scanner.getText().toString();
        // 创建一个输出文件对象
        File output = new File(outputFile);
        // 如果输出文件已经存在,则删除它
        if (output.exists()) {
            output.delete();
        }
        // 创建一个 BufferedWriter 对象用于向输出文件写入内容
        BufferedWriter writer = new BufferedWriter(new FileWriter(outputFile));
        // 将扫描的文本内容写入输出文件中
        writer.write(scannedText);
        // 关闭 BufferedWriter 对象以释放资源
        writer.close();
    }
}申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。
 



 
					



