把网页保存为可复制可编辑的PDF

发布时间 2023-04-12 15:43:55作者: 范哥范小飞

当你在网上看到了一篇文章,想永久保存下来,你会怎么办?
ctrl+S保存为html或者mhtm?有时候html里有代码不让你保存、或者保存后打开内容有问题(如某csdn保存的html会跳转),有时候保存的网页html里图片不会正常显示(如wei信的公众号的文章在浏览器打开保存,并非wei信不让保存,而是它格式问题),有的保存的html在本地打开是空白。

保存为云笔记?那就不是本地保存了,而且万一以后倒闭了怎么办?

浏览器自带一个非常强大的功能————另存为PDF,注意不是“导出为WPS PDF”或者“Microsoft print to PDF”或者“Microsoft XPS document write”。

这样保存出来的pdf文件内容还可以可以复制。

这篇文章还没完,有的网页的打印会出现格式错误(比如csdn格式混乱、百度文库是空白)。
这里再保存一些脚本,打印前在浏览器控制台运行一下,方便食用。

csdn的

(function(){
$("#side").remove();
$("#comment_title, #comment_list, #comment_bar, #comment_form, .announce, #ad_cen, #ad_bot").remove();
$(".nav_top_2011, #header, #navigator").remove();
$(".p4course_target, .comment-box, .recommend-box, #csdn-toolbar, #tool-box").remove();
$("aside").remove();
$(".tool-box").remove();
$("main").css('display','content'); 
$("main").css('float','left'); 
$("tool-box").remove();
$("#rightAside").remove();
$(".left-toolbox").remove();
$(".csdn-side-toolbar").remove();
document.body.className ="";
})();

百度文库等一些带有反打印的网页,使用f12把不需要的html页面元素、js脚本都删掉。

保存的pdf还可以转为word的doc格式,而且不会乱。