java实现百度OCR图片文字识别

发布时间 2023-09-20 18:09:54作者: lanwf

java实现 百度OCR 图片文字识别

最近在做一个扫描图片识别文字的功能,决定用百度AI开发平台完成

1 打开网址

​ 打开地址:https://ai.baidu.com/

image-20230920164534005

手机验证码登录

image-20230920164812899

2 选择通用文字识别

开放能力-> 文字识别->通用文字识别

image-20230920170126731

3 进入到通用文字识别页面

image-20230920170436092

4 API的调用使用方式

image-20230920170742243

(1) 首先进入点击 免费尝鲜 领取资源接口

注: 如果没有实名认证,需要用手机实名认证一下即可

image-20230920171100332

(2)继续点击 第二个 创建应用

image-20230920171641243

(3)服务调用

官方调用方式: https://cloud.baidu.com/doc/OCR/s/Ck3h7y2ia

通用文字识别调用方式:https://cloud.baidu.com/doc/OCR/s/zk3h7xz52

测试案列:

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.jfinal.club.util.baidu.Base64Util;
import com.jfinal.club.util.baidu.FileUtil;
import com.jfinal.club.util.baidu.HttpUtil;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import java.util.List;
import java.util.Map;

/**
 * @Date: 2023/9/20 12:38
 * @Description: 百度文字识别
 */
public class BaiduOCR {

    /**
     * 获取权限token
     * @return 返回示例:
     * {
     * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
     * "expires_in": 2592000
     * }
     */
    public static String getAuth() {
        // 官网获取的 API Key 更新为你注册的
        String clientId = "fZGbeAxB02UsgGH7oo8f528T";
        // 官网获取的 Secret Key 更新为你注册的
        String clientSecret = "lrDZxhT1kz1V4fcdcuc8gvf7AP3KWpWl";
        return getAuth(clientId, clientSecret);
    }

    /**
     * 获取API访问token
     * 该token有一定的有效期,需要自行管理,当失效时需重新获取.
     * @param ak - 百度云官网获取的 API Key
     * @param sk - 百度云官网获取的 Securet Key
     * @return assess_token 示例:
     * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
     */
    public static String getAuth(String ak, String sk) {
        // 获取token地址
        String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
        String getAccessTokenUrl = authHost
                // 1. grant_type为固定参数
                + "grant_type=client_credentials"
                // 2. 官网获取的 API Key
                + "&client_id=" + ak
                // 3. 官网获取的 Secret Key
                + "&client_secret=" + sk;
        try {
            URL realUrl = new URL(getAccessTokenUrl);
            // 打开和URL之间的连接
            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
            connection.setRequestMethod("GET");
            connection.connect();
            // 获取所有响应头字段
            Map<String, List<String>> map = connection.getHeaderFields();
            // 遍历所有的响应头字段
            for (String key : map.keySet()) {
                System.err.println(key + "--->" + map.get(key));
            }
            // 定义 BufferedReader输入流来读取URL的响应
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            String result = "";
            String line;
            while ((line = in.readLine()) != null) {
                result += line;
            }
            /**
             * 返回结果示例
             */
            //System.err.println("result:" + result);
            JSONObject jsonObject =  JSON.parseObject(result);
            String access_token = jsonObject.getString("access_token");
            return access_token;
        } catch (Exception e) {
            System.err.printf("获取token失败!");
            e.printStackTrace(System.err);
        }
        return null;
    }


    public static String generalBasic() {
        // 请求url
        String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";
        try {
            // 本地文件路径
            //String filePath = "[本地文件路径]";
            String filePath = "D:\\abc.webp";
            byte[] imgData = FileUtil.readFileByBytes(filePath);
            String imgStr = Base64Util.encode(imgData);
            String imgParam = URLEncoder.encode(imgStr, "UTF-8");

            String param = "image=" + imgParam;

            // 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
            //String accessToken = "[调用鉴权接口获取的token]";
            String accessToken = getAuth();

            String result = HttpUtil.post(url, accessToken, param);
            return result;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return null;
    }

    public static void main(String[] args) {
        String s = generalBasic();
        JSONObject j = JSON.parseObject(s);
        String text = j.getJSONArray("words_result").getJSONObject(0).getString("words");
        System.out.println(text);
    }
}

(4) 结果

image-20230920175736076