去除网页中的javascript 代码和 多余的 div的方法
public static String htmlspecialchars(String str) { // str = str.replaceAll("&", "&"); // str = str.replaceAll("<", "<"); // str = str.replaceAll(">", ">"); str = str.replaceAll("<div(.*)|(.*)(\n*)</div>", ""); str = str.replaceAll("<script(.*)|(.*)(\n*)</script>", ""); return str; }