这工具确实挺厉害的,它能帮你把网页上的数据抓下来存成表格或者XML文件,不管你是想用正则表达式、XPath还是CSS选择器来抓,它都能搞定。界面挺友好的,配置选项也多,批量抓和定时抓都没问题,处理数据的时候还能过滤、排序、合并,导出格式也多,确实能省不少事。我看了下它的特点,多线程、自定义蜘蛛引擎、支持代理和密码保护网站这些功能都很实用,尤其是那个智能的自定义蜘蛛引擎,能抓整个网站,对于需要大量数据的人来说简直是神器。最近的更新还优化了提取功能,工具栏图标也更显眼了,用起来应该更顺手。总的来说,这工具对需要频繁抓取网页数据的人来说,绝对是提高效率的好帮手。 软件特点 1、多线程与用户定义时间 2、高速下载带宽选择 3、智能的自定义蜘蛛引擎,包括整个网站 4、包含/排除超过60个标准MIME文件类型的过滤器 5、自动检测重复的文件 6、自定义链接的深度级别 7、重新链接文件在本地脱机浏览 8、完整的HTTP错误链接检查和处理 9、详细的文件下载监控 10、身份验证支持密码保护的网站 11、支持代理服务器下载 更新日志 v3.4.5版本 新功能: 更好的提取内化。 工具栏图标已经着色,以便更好地区分它们。
共有 0条评论