«September 2025»
123456
78910111213
14151617181920
21222324252627
282930


公告
因特网是一个巨大的和迅速发展的信息资源。但大多数信息都是以无结构的文本形式存在,使得查询信息变得非常困难。网络信息采集就是应运而生的,欢迎大家一起来交流!http://www.knowlesys.cn/

我的分类(专题)

首页(19)
信息采集(3)
资源技巧(6)
社会热点(3)


最新日志
怎样利用信息技术收集网络文献
利用网络收集,为案件找到更多的线索
中小企业站点的seo绝招
我的网站推广20法
整合营销--现代营销的发展方向
实例教你30种绕过前台的技巧
2008年信息安全服务市场发展报告
网络搜索排名有玄机
亚洲200佳 中国88家企业居首
Windows Server 2008

最新回复
回复:中小企业站点的seo绝招
回复:中小企业站点的seo绝招
回复:Web数据挖掘的研究现状与发展[论
回复:新闻采集程序——让千万记者为你写稿
回复:中小企业站点的seo绝招

留言板
签写新留言


统计
blog名称:信息采集高手
日志总数:19
评论数量:23
留言数量:-2
访问次数:192558
建立时间:2008年8月14日

链接
1. 自动抓取,网络信息自动抓取,网页自动提取 2. 中国互联网络信息,网络信息采集,网页数据提取 3. 数据整合,网络信息采集,网页数据整合 4. 抓取,网页数据抓取 5. 抓取软件,网络信息采集软件,网页数据抓取软件 6. 如何采集信息,网络信息采集,网页数据提取 8. 信息采集,网络信息采集,网页数据提取 9. 信息采集系统,网络信息采集,网页数据提取 10. 信息采集技术,网络信息采集,网页数据提取 11. 网站信息万能采集器,网络信息采集,网页数据提取 12. 信息梳理和采集软件,网络信息采集,网页数据梳理 13. 网络信息采集器,网页数据提取器 14. 信息采集程序,网络信息采集,网页数据提取程序 15. 信息采集员,网络信息采集,网页数据提取 16. 信息整合,网络信息采集,网页数据整合 17. 信息资源采集,网络信息采集,网页资源提取 18. 网络信息采集软件,网页数据提取软件 19. 信息利用与信息采集,网络信息采集,网页数据提取 20. 整合营销 -- 利用网络信息整合与网页数据整合 21. 网络采集,网络信息采集,网络数据提取 22. 信息网络建设,网络信息采集,网页数据提取 23. 网络信息资源,网络信息采集,网页数据提取 24. 网络信息采集专家,网络信息采集,网页数据提取 25. 网络信息采集大师,网络信息采集,网页数据提取 21. 网络采集,网络信息采集,网络数据提取 22. 信息网络建设,网络信息采集,网页数据提取 23. 网络信息资源,网络信息采集,网页数据提取 31. 网页数据库,网络信息采集,网页数据提取 32. 网页抓取,网络信息采集,网页数据抓取 33. 乐思软件为您提供强大的网页抓取工具/网页数据抓取工具 24. 网络信息采集专家,网络信息采集,网页数据提取 25. 网络信息采集大师,网络信息采集,网页数据提取 26. 网络信息检索,网络信息采集,网页数据提取 27. 新闻采集程序 -- 用乐思新闻采集系统 28. 新闻自动采集系统,网络信息自动采集,新闻采集 29. 新闻采集器,网络信息采集,网页新闻提取器 30. 新闻采集系统--乐思新闻采集系统是您的最佳选择 34. 网页图片抓取器--乐思软件定制网页图片抓取器 35. 网址抓取器 定制网址抓取器 36. 网页图片抓取,网页数据抓取,网络信息采集 37. 资源整合 -- 利用乐思信息采集系统进行网络资源整合 38. 通用信息采集--乐思通用网络信息采集系统问世了! 39. 垂直搜索引擎 提供垂直搜索引擎采集系统 40. 网站抓取 为您定制网站抓取软件1.Data Collection 2.Data Extraction 3.Data Extraction from Web 4.Extracteur Web   5.Extraction,Extraction and Extraction on web! 6.Extraction Information   7.Web Grabber   8.Web Mining   9.Html Data Extraction   10.Html Extraction   11.Information Extraction 12.News Content for Web Site   13.Screen Scraping 14.Site Scraping   15.Web Data Extraction 16.Web Data Extraction 17.Web Data Extraction Service 18.Web Data Extraction Services   19.Web Data Extractor 20.Web Data Grabber   21.Web Data Mining 22.Web Extraction 23.Web Scraping     24.Web Scraping 25.Website Extraction   26.Build a website, 27.Direct Search Engine 1 28.Direct Search Engine 2, 29.Web Data 30.Web Content 31.Web Data Extraction



本站首页    管理页面    写新日志    退出

[信息采集]乐思文本采集系统
信息采集高手 发表于 2008/8/14 14:34:25

一、 主要功能 乐思文本采集系统的主要功能为:根据用户自定义的任务配置,批量而精确地抽取目标文本文件中的内容,转化为为结构化的记录,保存在本地数据库中。 特别适用于网络博客/Blog文章采集,RSS/ATOM XML内容采集,Text/CSV内容采集,任意格式XML采集,自定义结构文本内容采集等。功能示意图如下所示: 二、 系统特点 500)this.width=500'>支持远程HTTP或者FTP服务器上的文本文件内容抽取 500)this.width=500'>支持本地文本文件内容抽取 500)this.width=500'>支持常用的文件格式: *.TXT, *.CSV, *.XML, *.HTM 500)this.width=500'>支持任意后缀名的文本文件 500)this.width=500'>内置六种记录块分割方式,几乎可以支持任意格式数据的抽取 500)this.width=500'>支持命令行格式,可以Windows任务计划器配合,定期抽取目标数据 500)this.width=500'>支持记录唯一索引,避免相同信息重复入库 500)this.width=500'>支持数据库表结构完全自定义 500)this.width=500'>保证信息的完整性与准确性 500)this.width=500'>支持各种主流数据库,如MSSQL、Access、MySQL、Oracle、DB2、Sybase等 三、 运行环境 操作系统:Windows XP/NT/2000/2003 内存:最低32M内存,建议128M或以上 硬盘:最少20M空余硬盘空间 四、 行业应用 Web Text Miner主要用于:网络实时数据的抽取,本地特殊格式数据的抽取。 500)this.width=500'>门户网站 可以做到: 500)this.width=500'>每天定时抽取目标网站的新闻RSS聚合或者Blog聚合中的信息(标题,作者,内容等)到数据库中 利益: 500)this.width=500'>轻松整合不同来源的网络新闻与网络日志 500)this.width=500'>股票证券行业 可以做到: 500)this.width=500'>每天定时自动将指定的远程文本文件或网页中的行情数据采集到数据库中 利益: 500)this.width=500'>轻松获取行情数据库 500)this.width=500'>实时行情分析 500)this.width=500'>金融行业 可以做到: 500)this.width=500'>每天定时自动将指定的远程文本文件或网页中的金融信息采集到数据库中 利益: 500)this.width=500'>轻松获取行情数据库 500)this.width=500'>实时行情分析 500)this.width=500'>科研机构 可以做到: 500)this.width=500'>某些科研应用程序的输出只能为文本文件,可以同过本软件将其转换到数据库中 利益: 500)this.width=500'>在无需编程人员的帮助下,就可以轻松转换数据,每分钟可以处理几十M的数据 详细资料,请查看: http://www.knowlesys.cn  

阅读全文(3778) | 回复(0) | 编辑 | 精华


发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)
站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.031 second(s), page refreshed 144769878 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号