1
harry890829 2017-02-15 09:34:35 +08:00
自己写个爬虫自己爬?算是把学习的东西用到生产上吧。
官方功能没有找到,看看楼下大神 |
2
zhengjian 2017-02-15 09:46:16 +08:00
https://www.v2ex.com/my/topics 如果不是很多的话,在收藏页面 Ctrl/Command + F 页面内搜索?我收藏的主题还不多,分页的话就麻烦啦。看看楼下大神
|
3
tuteng OP 我自己写过一个,但是由于内容格式很混乱,导入到 evernote 中间老是出错,最终就放弃了
|
4
xycool 2017-02-15 10:40:26 +08:00
想起 https://www.v2ex.com/t/332670#reply121 这个帖子,把原来的脚本改造了一下,可实现根据关键字搜索 title 。
var keyWords = "出国"; //需要搜索的关键字 var Urls = function(startUrl){ this.startUrl = startUrl; this.page = 1; this.result=new Array(); Urls.prototype.crawl = function(){ var self = this; var url = this.startUrl + this.page; var end = false; $.get(url, function(data, status){ console.log('正在搜索第'+self.page+'页'); self.page += 1; var parser = new DOMParser(); var doc = parser.parseFromString(data, "text/html"); var maxPageIndex = doc.querySelectorAll("#Main>div.box>div:nth-child(23)>table>tbody>tr>td").length; var topics = doc.querySelectorAll("#Main>div.box>div.item"); topics.forEach(function(ele){ var aTag = ele.querySelector("table > tbody > tr > td:nth-child(3) > span.item_title > a"); if(aTag.outerText.includes(keyWords)) self.result.push({title:aTag.outerText,url:aTag.getAttribute("href")}); }) if(self.page>maxPageIndex){ return console.log(JSON.stringify(self.result)); } self.crawl(keyWords); }); } } new Urls('https://www.v2ex.com/my/topics?p=').crawl(keyWords); |
7
dallaslu 2017-02-15 14:10:01 +08:00
森马四搜藏?
|
9
dong3580 2017-02-15 16:13:49 +08:00 1
|
10
nightwind 2017-02-15 17:10:02 +08:00
有问题直接 save in pocket ,要搜藏干什么, pocket 可是全网
|