Java 获取Html标签中各属性值

发布时间 2023-08-23 15:27:18作者: 嘻哈•﹏•亻

该方式适用于取任何标签的任何属性 只要对应替换标签名和属性。

public static Set<String> getImgStr(String htmlStr) {
    Set<String> pics = new HashSet<String>();
    String img = "";
    Pattern p_image;
    Matcher m_image;
    String regEx_img = "<audio.*attr\\s*=\\s*(.*?)[^>]*?>";
    p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
    m_image = p_image.matcher(htmlStr);
    while (m_image.find()) {
        // 得到<img />数据
        img = m_image.group();
        // 匹配<img>中的src数据
        Matcher m = Pattern.compile("attr\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
        while (m.find()) {
            pics.add(m.group(1));
        }
    }
    return pics;
}