批次备份BBS看板中的文章,并转成HTML网页!(KUSO PTT BBS Board Crawler)
前几天才介绍过「telegram中文:将BBS邮件转成HTML网页档,备份在自己电脑中」这篇文章,可以帮我们将PTT上的私人邮件备份成HTML网页档,,
继续阅读
这软体算是属於私人备份用途,该作者以GPL V2释出,并叮咛大家不要把它改成类似之前争议很大的「YouSee柚子」的那种全文服务器引擎,可能是希望在还没有完整配套方案出来之前,尽量不要贸然行事造成原本BBS的生态造成太大的冲击。 (对了,「YouSee柚子」BBS服务器引擎又复活了!)
软体名称:KUSO PTT BBS Board Crawler
软体版本:beta 2
telegram中文官网:
直接telegram中文版下载: telegram中文:telegram中文版下载2
未修正bug:
1. 已经尽量不要掉文了, 爬文方式与PCMantelegram中文版下载整篇文章作法不太相同, 但多少会
2. 不要输入错误的看板名称, 目前防呆没有做的非常完善!!
3. guest 无法正常登入使用, 将於下一个版本修正!!
使用方法:
使用方法其实很简单,不过抓文过程中必须输入你的PTT帐号、密码,如果不放心的话,可以另外申请一个爬文专用帐号来玩玩,不要就直接把你的帐号密码给打上去了。另外,BBS版的名称记得得输入正确的英文,打错的话会抓不到文章唷。
一、用「BBS Board Crawler」程式撷取BBS文章
第1步 目前该程式仅开放撷取PTT与PTT2两个BBS站的文章,先用PCMan或其他程式开启你要撷取文章的看板,然後将看板右上角的版名复制下来,如「SuperStarAve」。接着在版面上先找好要从哪一篇文章撷取到哪一篇文章。
第2步 接着在「crawler.exe」档案上按两下,开始执行BBS文章撷取功能。接着请依照你要撷取的BBS站,选择1或2。
第3步 分别在帐号、密码处输入你的BBS帐号与密码,如果不放心可以另外申请个测试用帐户试试看。输入完毕後按下键盘上的〔Enter〕按键。接着请输入刚刚复制下来的BBS看板名称,如「SuperStarAve」,再按下〔Enter〕。
第4步 接着请分别输入撷取范围的文章编号,输入完成後再按下〔Enter〕。
第5步 如图,PTT BBS Board Crawler程式便会自动抓取你所指定的范围中的全部文章,等出现「撷取完毕」的画面後,表示已经顺利完成文章撷取工作。
二、撷取完成的BBS文章画面
第1步 完成上面的文章撷取工作後,我们可以看到桌面上多出一个名为「ptt.cc」的资料夹,请开启该资料夹,我们可以看到里面有一堆「.html」的档案,这些都是BBS的文章,每一个「.html」档案就是一篇文章。
找到了「index.htm」档案,并用IE浏览器开启,这就会全不小文章的检索画面。
第2步 开启「index.htm」档案後,我们可以在每篇文章的篇名上按一下滑鼠左键,开启该文章的内文。
第3步 如图,原本的BBS版上有啥内容,现在就可以看到啥内容。
第4步 连下面的推文也都有唷!虽然还是有些小小瑕疵,不过已经是太好用罗!对於想要批次备份BBS文章的人来说,简直是天上掉下来的礼物呀!
,
访客留言:
5 Replies to “批次备份BBS看板中的文章,并转成HTML网页!(KUSO PTT BBS Board Crawler)”