不但具有强大的采集功能,同时也有强大的导入功能,避免写正则表达式烦恼,支持多站点采集,多类型文章系统导入
v.1.1.1 Beta更新:
新的特性:
1.增加了采集器配置的导入导出.数据用XML格式进行存储.
2.修正了用户提交和我们发现的已知的全部BUG。
修复列表:
1.修正采集/测试连接时,会碰到一些pdf,zip...的文件地址,需要过滤的问题
2.修正入库时,碰到一些无效地址,需要虑除,否则容易出现死循环的问题
3.修正连接的表达式处在不足,当碰到一些少见的字符时就取不到,比如"(",")的问题
4.修正入库时,碰到一些没有标题或者内容的,需要标记"不采用",否则容易出现死循环的问题
5.修正连接中&的问题
6.修正图片地址类似<img src="?file=articles&type=image&id=28&orderid=3">而提取不到的问题
7.修正JS搞死IE的问题
无病毒
无广告
用户保障
展开