整容说文库 > 程序代码 > 教育资讯

如何保存网页里的内容

来源:学生作业帮助网 编辑:整容说文库 时间:2020/12/04 16:22:12 程序代码
如何保存网页里的内容程序代码
比如说这个网页
http://rate.taobao.com/user-rate-UOF8LvCgGOmkT.htm?spm=a1z10.1.0.0.EpruaB

打开网页后,有较多的样式

我想把这个网页保存到本地成1个htm网页

打开本地这个htm网页,显示的内容和直接打开连接显示的一样,有什么方法?



            string url = "http://rate.taobao.com/user-rate-UOF8LvCgGOmkT.htm?spm=a1z10.1.0.0.EpruaB";
            Uri uri = new Uri(url);
            WebClient wc = new WebClient();
            wc.DownloadFile(uri, "E:\\" + uri.LocalPath.TrimStart('/'));

用snagit,它可以精确保存网页。
原理是截图,但是不是一般意义的截图,因为它可以一次性滚动整个页面,把网页全部取出,同时还捕获所有链接,并且放置在网页正确的位置上,所以用snagit截取的网页,链接都是有效的。
引用 1 楼 ojlovecd 的回复:

            string url = "http://rate.taobao.com/user-rate-UOF8LvCgGOmkT.htm?spm=a1z10.1.0.0.EpruaB";
            Uri uri = new Uri(url);
            WebClient wc = new WebClient();
            wc.DownloadFile(uri, "E:\\" + uri.LocalPath.TrimStart('/'));


不是直接获取原始网页内容,这个网页打开后,会运行js,变出一些样式来
引用 2 楼 caozhy 的回复:
用snagit,它可以精确保存网页。
原理是截图,但是不是一般意义的截图,因为它可以一次性滚动整个页面,把网页全部取出,同时还捕获所有链接,并且放置在网页正确的位置上,所以用snagit截取的网页,链接都是有效的。

我去试一试,先谢谢了
我测试了snagit 是把网页截屏成pdf了

但是我想要的这个页面变出htm

打开这个htm,我还可以自己编辑
         string url = "http://rate.taobao.com/user-rate-UOF8LvCgGOmkT.htm?spm=a1z10.1.0.0.EpruaB";
            Uri uri = new Uri(url);
            WebClient wc = new WebClient();
            wc.DownloadFile(uri, "E:\\" + uri.LocalPath.TrimStart('/'));

这个方法可以呀,后边,你在修改者file就可以了呀!
看看这个讨论中标记为答案的那个回答
Download page html and css in C#
http://stackoverflow.com/questions/10027673/download-page-html-and-css-in-c-sharp
引用 5 楼 xkx2003 的回复:
我测试了snagit 是把网页截屏成pdf了

但是我想要的这个页面变出htm

打开这个htm,我还可以自己编辑

支持mht和html的。你没有选对。
引用 8 楼 caozhy 的回复:
Quote: 引用 5 楼 xkx2003 的回复:

我测试了snagit 是把网页截屏成pdf了

但是我想要的这个页面变出htm

打开这个htm,我还可以自己编辑

支持mht和html的。你没有选对。


我用snagit  9.0 这个版本,截了屏,保存的时候,选择了mht(没找到html),得到的不是html元素。保存后,无法修改。
引用 6 楼 dongdongdongJL 的回复:
         string url = "http://rate.taobao.com/user-rate-UOF8LvCgGOmkT.htm?spm=a1z10.1.0.0.EpruaB";
            Uri uri = new Uri(url);
            WebClient wc = new WebClient();
            wc.DownloadFile(uri, "E:\\" + uri.LocalPath.TrimStart('/'));

这个方法可以呀,后边,你在修改者file就可以了呀!


这个方法能下载到htm文件,但是关键的2处地方,不显示。
你可以看看
引用 9 楼 xkx2003 的回复:
Quote: 引用 8 楼 caozhy 的回复:

Quote: 引用 5 楼 xkx2003 的回复:

我测试了snagit 是把网页截屏成pdf了

但是我想要的这个页面变出htm

打开这个htm,我还可以自己编辑

支持mht和html的。你没有选对。


我用snagit  9.0 这个版本,截了屏,保存的时候,选择了mht(没找到html),得到的不是html元素。保存后,无法修改。

你可以用IE的F12功能直接修改,再截图。
程序代码