喜歡看小說的用戶很多的都是需要把小說下載到自己的手機上面,但是很多的網站不支持一鍵下載,可以使用善肯網頁TXT采集器,自動采集以及下載!
善肯網頁TXT采集器介紹
喜歡下載到本地慢慢看,但是很多小說網站不支持下載,或者下載有限制【非VIP小說】,也在論壇里面找過一些采集器,但是個人覺得不太好用,輸入正則表達式后,會出來章節,但是點擊下載卻并不能把文本下載下來,我做好這個軟件后也繼續測試過,同樣的正則表達式,那些軟件確實匹配不出內容,所以下載失敗。也有可能是那些軟件有些我不知道的規則,但是結果就是并不能完成我想要的下載。甚至不知道是規則的問題還是軟件的問題又或者是網站設置原因……
善肯網頁TXT采集器使用教程
關于規則設置
1、輸入網址后,可以實時預覽(不論有有沒規則,有規則就是匹配規則后的內容,沒有就是源代碼,目前測試,并非所有網頁都能獲取其內容,具體大家可以自己去實驗,能獲取源代碼的就是可以匹配出內容的)
2、目錄頁和內容頁分別匹配不同的規則:
目錄頁:
文本名稱規則
作者名稱規則
章節規則(此處需有兩個()一處匹配章節路徑,一個匹配章節名稱)
內容頁:
內容規則
3、關于替換:
通用替換(非正則):所有規則都會自動加上通用替換(有共性的替換規則)
定制替換(非正則):單個網站的特有替換規則
正則替換:暫未開發,請求打賞支持開發~~。
想換行可用內容與\n進行替換,\n是替換數據不是原數據。
可以根據自己的需求增刪,。(原數據和替換數據必填,一個空格都行,否則會拋異常)
刪除:選中一行,按DELETE鍵刪除
4、關于規則保存:
保存都是以文件名來的,不同的名稱則為不同的規則,最終保存為xml形式。
5、關于地址解析
解析地址1:測試未刪,以后會加功能,暫留著
解析地址2:推薦使用
6、理論上,只要是目錄頁指向內容頁的形式都可以抓取【能獲取源代碼的情況下】。具體請大家自己去實驗。
關于文件
1、commonrule.xml 文件存放的是通用替換規則,
2、rule文件夾下存放的是以網站為單位的規則。
如果需要直接拷貝單條規則放到rule文件夾下就可以使用規則了,前提是xml文件格式是對的,
3、其他
暫時還沒想到你們可能還會出現什么問題。如果遇到問題歡迎反饋。
最后附上常用匹配全部內容的表達式:
(.*?) ([\w\W]*?) ([\s\S]*?)
- PC官方版
- 安卓官方手機版
- IOS官方手機版