|
|
| 运行环境 |
Win9x/NT/2000/XP/2003/ |
|
| 整理时间 |
2008-10-11 3:11:11 |
| 软件星级 |
 |
| 软件语言 |
简体中文 |
| 软件类型 |
免费源码 |
| 授权方式 |
免费版 |
| 软件大小 |
21.4 MB |
| 相关连接 |
暂无联系方式 Home Page 没有预览图片
[收 藏] |
| 下载统计 |
|
|
| 下载地址 |
 |
|
|
|
|
| 软件简介 |
①安装说明 1、火车采集器V2008版要求:您的电脑必须安装.net framework2.0框架 附windows .net framework 2.0下载地址:http://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe 2、下载附件内程序包直接解压即可使用。 ②升级说明 如果您想保存原3.2SP5版软件的规则或采集数据,并直接升级到2008版,请在使用前执行程序目录下面的Update325To2008.exe按说明进行升级,该升级程序免费版及商业版通用
③2008版功能更新
修改功能 1、重写的自动更新模块,新增自动更新调度管理器,可计算各任务下次启动时间,管理更加直观 2、重写的任务运行管理器,不再采集定时刷新的方式管理任务队列 3、更新了中文分词模块,加入了对词性和词频的分析,使提取的关键字更加准确,并可以挂接用户词库 4、修改了多页设置内在默认页采集得到地址不再使用正则规则,而使用[参数]标签组合结果的简单方法设置 5、WEB发布模块发布地址和引用地址内加入了随机登录值标签的支持 6、修正了时间转换标签已存在的bug,支持更多种时间格式的转换 7、修复了数据库入库超过两次后出现索引超出范围。必须为非负值并小于集合大小的错误 8、修正了随机登录值标签UrlEncode不成功的问题 9、去除了任务完成后的提示音 10、去除了系统设置内标题内容标签是否不得为空的设置,改为可以对任意标签进行设置 11、加入了对更多种下载文件格式的支持 12、修改单个标签可设置是否在分页中匹配的功能,分页与多页不再冲突,至此可以完美采集论坛的所有楼层及分页回复 新增功能 (部分功能分配到免费版及个人版) 1、加入了对Sqlite数据库的支持,本地数据采用Sqlite保存,相比Access性能得到巨大提高 2、加入了外部编程接口,用户可以火车采集器内使用自己编写的php接口文件处理标签数据 3、加入了可视化编辑器及高亮文本编辑框,对本地数据的后期编辑更加快速和直观 4、加入了内置FTP上传文件的功能,特别在自动更新时保证下载的文件同步更新到服务器 5、加入了对采集内容简体转繁体,繁体转简体及火星文之间的转换的功能 6、加入了对单个标签可设置必须包含不得包含,采集结果是否允许为空的设置,使采集结果更加精确 7、加入了对单个标签是否补全相对网址的功能 8、加入了对需要POST数据才能采集的列表类的网站的支持,实例中已能完美采集51job.com 9、加入了采集时可选是否检测重复网址的功能,增加采集的速度 10、加入了发布时可选随机发布的功能,实现文章的乱序排列 11、加入了分词测试工具、翻译测试工具 12、加入了自动识别网页编码和自己加载本地登录信息的功能,使设置更加简单,可实现采集多编码的多页网页
|
|
| 下载说明 |
为了达到最快的下载速度,推荐使用[迅雷]下载本站软件。
请一定升级到最新版[WinRAR3.8]才能正常解压本站提供的软件!
如果您发现该软件不能下载,请点击报告错误谢谢!
站内提供的所有源码软件均是由网上搜集,若侵犯了你的版权利益,敬请来信通知我们! |
|