
采集下载缩略图的方法
在ET中,我们可以从列表网页采集缩略图,也可以从文章网页采集缩略图。
一、从列表中采集缩略图
1、缩略图通常应用在文章列表页面,用于展示文章配图,我们可以在列表分析中,使用【缩略图标记】来采集它
使用标记后
2、然后在【缩略图数据项】中设置它的相关参数,注意,在ET2中,【缩略图数据项】中采集规则留空时,数据项的取值就是列表分析中【缩略图标记】的采集结果。在ET3中,默认是通过指定模式,选取数据项【列表缩略图】(即列表分析中【缩略图标记】的采集结果)作为缩略图的取值。
因为我们采集到缩略图通常是图片地址,所以,文件选项里勾选【作为文件网址】。
3、最后,设置文件下载。
4、最后,一定要在发布配置的发布项窗口中使用数据项标记给网站的缩略图参数赋值才会生效。
(上图是wordpres的图示,litpic是wordpress的缩略图参数名,其他网站缩略图参数名见接口说明书)
5、ET3支持多层列表,在多层列表中使用【缩略图标记】,将以最后一次使用【缩略图标记】的采集结果作为【缩略图数据项】的值。
二、从文章页面采集缩略图
1、列表分析不使用【缩略图标记】。
2、【缩略图数据项】要设置采集规则。
3、在采集页处,将【缩略图数据项】与采集的目标网页关联。
4、其他与从列表采集相同。
软件功能
1、设定好方案,即可24小时自动工作,不再需要人工干涉
2、与网站分离,通过独立制作的接口,可以支持任何网站或数据库
3、灵活强大的采集规则不仅仅是采集文章,可采集任何类型信息
4、小巧、低耗和良好的稳定性非常适合运行于服务器
5、所有规则都可以导入导出,灵活的资源重用
6、采用FTP上传文件,稳定、安全
7、下载上传支持断点续传
8、高速伪原创
软件亮点
1、无人值守免费自动采集器可选择倒序、顺序、随机采集文章
2、支持自动列表网址
3、支持对数据分布在多层页面的网站进行采集
4、自由设定采集数据项,并可单独过滤整理每个数据项
5、支持分页内容采集
6、支持任意格式、类型的文件(包括图片、视频)下载
7、可突破防盗链文件
8、支持动态文件网址分析
9、支持对需登录访问的网页的采集
10、可设定关键词采集
11、可设定防止采集的敏感词
12、可设置图片水印
软件特色
1、支持发布带回复的文章,可广泛用于论坛、博客等项目
2、与采集数据分离的发布参数项,可自由对应采集数据或预设数值,极大增强发布规则的重用性
3、支持随机选用发布账号
4、支持任意发布项语言翻译
5、支持编码转换、支持UBB代码
6、文件上传可选择好自动建立年月日子目录
7、模拟发布支持对无法安装接口的网站进行发布操作
8、方案可定时工作
9、防止网络运营商劫持HTTP功能
10、可手动进行单项采集发布
11、详尽的工作流程监视、信息反馈,让您迅速了解工作状态
更新日志
v3.7版本
1、新增:采集配置增加了主列表网址的HTTP Header请求头设置栏。
2、优化:采集配置中的主列表网址、下级网址、多层列表网址以及采集页网址都支持新的POST提交格式,更好的支持POST表单参数和JSON参数了。原有的“POST优先模式”不推荐使用,新的POST格式用法详见帮助。
3、优化:有道翻译API现在恢复使用了,由于该API不再免费,所以请先去有道翻译注册。
4、优化:改进了采集页的兼容性,可以尝试利用它来调用第三方网站的API。







































共有 0条评论