采集方法使用步骤
1、添加采集点,填写规则
2、采集网址与内容
3、发布内容
1、添加采集点
采集项目名:填写自己便于记忆的名字
采集页面码:采集目标的页面编码
网址类型:需要采集目标网址的类型
网址配置:要采集对目标网址
网址配置:采集内容的限定,设置详细规则
Base配置:目标网址有设置的话就要填写
<base> 标签为页面上的所有链接规定默认地址或默认目标
获取网址:查看目标网址的源码找到需要采集的开始点和结束点(这两个点在源码内要有唯一性),从而进一步的缩小采集范围
填写完规则后就可以提交点击测试来看采集结果了
内容规则
1、匹配规则请设置开始和结束符,具体内容使用“[内容]”做为通配符 。
2、过滤选项格式为“要过滤的内容[|]替换值”,要过滤的内容支持正则表达式每行一条。
标题规则:从网页<title></title>里取标题,并去除不需要的字符
内容规则:整个页面源代码中具有唯一性。并对内容进行过滤。
高级配置
可以设置下载的图片下载到服务器和是否打水印等选项
2、采集网址与内容
配置好规则后就可以进行网址采集与内容采集,最后进行内容发布
3、发布内容到指定栏目
选择已采集的数据进行导入
选择导入栏目
其它配置选项
采集标题要对应数据库字段
采集内容要与数据库字段建立对应
设置 采集内容与数据库的字段对应关系.提交进行数据入库,在此期间请耐心等待, 完成后会自动转向。
上一篇:msvod v9 标签调用
下一篇:msvod v9 内容页标签汇总