?火車采集器V7.0正式發(fā)布
讓大家久等了。新版本火車采集器經(jīng)過一年的開發(fā),終于和大家見面了。新版本對程序進行了完全的重構,升級為全新的采集平臺。軟件也更名為 火車頭數(shù)據(jù)采集平臺 ?;疖嚥杉魇腔疖囶^數(shù)據(jù)采集平臺的默認擴展。以后大家可以在該平臺上運行論壇采集器,微博采集器,站群客戶端,XX采集器。企業(yè)用戶還可以使用我們提供的API,開發(fā)有自己特色的采集器在平臺上使用。
新版本添加的功能有:
1、無限級多頁采集,可以實現(xiàn)無限深度的采集
2、任務隊列運行管理,支持Cron表達式
3、無限級分組任務管理,任務回收站功能
4、RSS地址采集功能
5、列表頁分頁采集獲取功能
6、列表頁附加參數(shù)獲取功能
7、列表頁及標簽XPath可視化提取功能
8、標簽純正則替換功能
9、Http接口管理采集器運行
10、導出記錄為單個或多個Txt、html 文件
11、標簽間自由組合功能
12、針對標簽內(nèi)容繼續(xù)發(fā)送Http請求功能
13、無限級列表網(wǎng)址采集
14、從Http頭信息中獲取數(shù)據(jù)
15、標題內(nèi)容正文提取功能
16、Aspx列表分頁自識別
17、多網(wǎng)站站群式web發(fā)布
18、導出記錄為Word格式
19、導出所有記錄為Excel格式
20、使用隨機二級代理服務器(支持Socket代理)
21、多擴展間數(shù)據(jù)交換功能
22、下載的圖片自動加增強型水印功能
23、Ocr識別(圖片轉化為文字)
24、Mongodb數(shù)據(jù)庫保存數(shù)據(jù)
25、主從服務器分布式采集
26、內(nèi)置瀏覽器Cookie獲取功能增強
27、任務列表樹支持無限級分組
28、Web發(fā)布和數(shù)據(jù)庫入庫支持插件功能
29、起始網(wǎng)址支持等差等比數(shù)列
修改的功能和修復的問題限于篇幅問題就不一一列出了。
安裝使用:下載軟件包解壓后直接運行 LocoyPlatform.exe啟動軟件,(保證您的電腦安裝有.net2.0框架,vista及win7系統(tǒng)用戶可能會提示請求管理員權限,請放行)。
升級:若要從3.2sp5,2008,2009或2010版直接升級到火車頭數(shù)據(jù)采集平臺1.0版,請運行程序目錄下的 UpdateTo7.0.exe,按提示進行升級即可。升級程序不會對原來的數(shù)據(jù)進行任何的修改,但為了防止用戶誤操作,請在升級前備份舊版本數(shù)據(jù)和配置。備份方法是將原采集器完整復制一份。
商業(yè)版:商業(yè)版用戶請從商業(yè)用戶通道,會員中心,論壇商業(yè)用戶區(qū)版塊下載到統(tǒng)一的商業(yè)版軟件,使用用戶名或密碼登錄軟件,如果您的升級服務期限在2012-02-20后,則可以免費升級到V7版并使用。
下載鏈接:
【免費版】http://www.yemaf99.com/Down/LocoySpider/LocoySpiderV7.html?
【商業(yè)版】請登錄會員中心[ http://www.yemaf99.com/member/licencemgr.php?]或在論壇商業(yè)用戶區(qū)下載
?