其实你可以用Java里的字符串处理类,比如StringBuffer或者StringBuilder,来手动解析HTML标签。大致思路是遍历整个字符串,遇到左尖括号就记录下标签名,然后继续读取直到遇到右尖括号为止,之后再维护一个栈结构,遇到开始标签就压栈,遇到结束标签就出栈,如果结束标签和栈顶的标签不一致,那可能就是标签不匹配或者需要自动补齐的情况了。当然这个方法比较原始,处理复杂页面可能会漏掉很多情况,不过对于简单需求应该够用了。另外还可以借助第三方库,比如Jsoup,它本身就有解析HTML的功能,能自动识别标签结构,你只需要解析完再输出标准化的HTML就可以了,省事很多