网络神采/狂采/火车头全功能,C#全部代码打包转让
时间:2010-10-09 来源:雪山飞狐12345
网络神采/狂采/火车头全功能,C#全部代码打包转让;
1、 多线程多任务采集器
a) 起始地址支持普通url地址、url序列递增、动态post序列url;
b) 树形导航过滤url路径,更快更精准;
c) 支持中间页采集数据,比如有些点击数、回复数、论坛版块名称的抽取;
d) 中间页使用简易脚本方式进行采集,配置极其容易,同时辅助向导帮忙确认配置是否正确;
e) 数据抽取支持传统字符串前、后缀数据抽取,高级的正则表达式抽取,最最亮眼的是“可视化的智能采集向导”,使用xpath对html结点进行高效、精准定位,最大限度降低了使用门槛;
f) 数据保存支持多终端,支持的终端包括:excel/access,mssql,mysql等数据库,同时支持数据直接写lucene索引,高效生成搜索引擎所需要的索引文件;
2、 数据发布模块
a) 支持像任何cms后台直接发布数据;已经内置了市场上知名的论坛,像discuz,phpwind,动网论坛等等,还有各类的cms;
b) 用户自行配置发布接口也比相关软件简单,我们采用模拟浏览器点击的方法对数据进行自动发布;
3、 倒排索引全部代码
a) 内置lucene最新版本的所有代码;
b) 高效的中文分词模块所有代码;
c) Lucene索引管理器C#所有代码,让您像管理数据库一样管理您的lucene索引文件;
d) 多线程、多路径lucene检索,支持检索语法、多域,模糊等各种形式;让lucene成为您海量数据访问的存储结构;
4、 辅助模块
a) 日志系统
b) 信息传递系统
c) 各种设计模式封装
5、 这些代码意味着什么?
a) 最短的时间,最小的成本,可以开张一家公司?
b) 做什么?采集器、舆情监控系统,口碑营销后台,广告效果监控,网络信息雷达,垂直搜索引擎,站内搜索引擎……
c) 代码的质量?作者有国内知名公司工作开发经验,多年的心血,历经多个版本改良,早已达到商用标准?商用是什么标准?一天采集千w条数据,连续一周软件稳定运行;1亿条数据检索响应时间为0.几秒……
d) 代码的可维护性:严格基于设计模式封装,mvc三层结构,对于升级开放,对于变化封闭;
6、 联系我:
QQ:86820609
建议企业联系,可当面交易或支付宝,价格面议。