新增功能和使用方法
1.采集规则
在采集规则管理里面可见
绿色参数NovelListFilter,是为采集书籍列表时不能过滤多余书籍id而设置的,他可以过滤要检索的html。
绿色参数PubContentPageUrl、PubContentPageKey 适用于采集文章内容分页而设置的,可以告别php了。
红色参数PubContentChapterName、PubContentChapterNum 有些站点几章使用了乱码,用这个可以把乱码章节名重新获取。
2.生成全站静态
在生成静态HTML可见
把原来的动态首页地址改下名称,就是叫他的首页不要默认那个伪静态的,然后用物理路径指向默认首页,生成新首页就可以了。
带参数的是高级功能,可以调用{Page}替换参数,可以生成列表页。
技巧:生成部分由于采集器和网站在同一服务器,故可以localhost作为网站地址,那样内部可以访问,而外部不能访问。
配合自定义路径,可以生成全站html,当然是在没有动态登录的情况下。搜索部分你就要和原来一样使用动态了,也可以配合ajax,看你自己的技术了。
3.动态代理
有了他你就不怕被封ip了。
打开自动代理模式,输入获取代理ip的网址(代理ip可以在http://www.kuaidaili.com/ 或者 http://www.daili666.com/等站点购买,包月就行)
开启一个或者多个自动代理,他就是测试ip可用性并把他存储,等ip超过10个了,你就可以使用代理了。会自动不停的换ip,叫目标占始料不及。
4.生成分页
为了更好的引擎收录效果,可以自动生成分页,在自定义路径里面可以设置,无需高级授权。
0 (0%) 好评 | 0 (0%) 中评 | 0 (0%) 差评 |