一起过>电脑网络>网站网络>

    dedecms 采集教程大全

    时间:2008-11-20

    3、选择节点后点击“采集”按钮进入采集页面,在右上方有“导出数据”按钮,点击后也可进入入库操作页面 
    进入后的入库操作页面见图5 

    图5 
    图5  
     

    首先选择要导入到的栏目,按“请选择”那里即可在弹出的窗口中选择你需要导入的栏目 
    发布选项这里一般默认即可,除非你不想马上发布。 
    每批导入默认是30条,这里修改与否都无所谓,因为导入操作的速度还是蛮快的 
    附带选项一般选“排除重复标题”,至于自动生成HTML那个选项建议先别生成,因为我们还要去批量提取摘要和关键字,这就是后 
    话了。 
    上面的配置OK以后,接下来就是按“提交”让系统自己去处理了。完成下面会有提示信息。 

    到这里,采集教程就基本结束,接下来我会介绍一些过滤规则和分页采集教程。喜欢的朋友敬请关注。 

     【DEDECMS采集基础教程】过滤规则篇(四)
    经过前面三篇的介绍,对于dede的采集我们也有基本的了解和操作能力,对于采集简单的内容来说也足够用了。然而对于大多数网站来说,现在广告是网站收入的一个重要来源,因此在网页中常会嵌入广告代码。我们在采集的时候,如何将其过滤掉,从而避免了自己帮别人免费挂广告呢?又例如某些文章里面某些关键词有了他们自己网站上的其他文章链接,你是否愿意让你辛苦采集回来的文章里包含了他的链接?这一切,只需简单的过滤规则,即可给你一篇干净的文章。 
    dede的过滤规则并不难写,其写法如下面 
    {dede:trim}这里就是要过滤的内容{/dede:trim} 
    如果你要过滤的内容比较简单的代码,完全可以直接在“{dede:trim}”和“{/dede:trim}”之间写上,如果比较复杂的就要用到正则了。 
    1、例如采集中去除内容里的超链接的规则如下: 
    {dede:trim}<a([^>]*)&gt;{/dede:trim} 
    {dede:trim}</a>{/dede:trim} 
    假如要将所有超链接内容都去除,规则是:{dede:trim}<a([^>]*)&gt;([^<]*)&lt;/a>{/dede:trim} 
    这两个规则的不同通过下面代码来解释 
    例如文章代码中包含着如下内容:<a href="#">超链接</a> 
    上一页 1 2 3 4 5 67 8 9 10 下一页
  • 上一篇:天涯社区虚拟之罪 感慨论坛管理革新之难
  • 下一篇:阿里巴巴回购429万港元股票

    推荐内容

  • 京东不带https的页面被qutaobi劫持

    现在京东网站大多数页面都是自动打开https,安全链接,比较好。但有的时候也会打开不...

  • 微信使用知识介绍 微信段子分享

    一起过帮大家整理了有关微信的相关知识,一起了解下吧!...

  • 天猫积分有效期及用处介绍

    经常网购的朋友们应该很清楚啦,天猫积分的获得一般是你在天猫商城里面购物的时候,等...

  • 微信公众号怎么申请 流程方法介绍

    虽说微信公众号已成为企业、商家必不可少的一项营销手段,但很多人对于如何创建公众号...

  • 限时玩玩烧脑游戏有益大脑提高脑力

    限时玩玩烧脑游戏有益大脑提高脑力 电子游戏的本质之一是“主动学习”,它...

  • 做微商有没有技巧?朋友圈营销心得

    做微商首先要学会玩朋友圈,熟识你的人多了,才能慢慢推广业务。一般搞笑类说说浏览量...

首页常识美食医生旅游

笑话IT老人男女育儿
返回首页 | 电脑端