?火車采集器V7.0正式發(fā)布
讓大家久等了。新版本火車采集器經(jīng)過一年的開發(fā),終于和大家見面了。新版本對程序進(jìn)行了完全的重構(gòu),升級為全新的采集平臺。軟件也更名為 火車頭數(shù)據(jù)采集平臺 。火車采集器是火車頭數(shù)據(jù)采集平臺的默認(rèn)擴(kuò)展。以后大家可以在該平臺上運(yùn)行論壇采集器,微博采集器,站群客戶端,XX采集器。企業(yè)用戶還可以使用我們提供的API,開發(fā)有自己特色的采集器在平臺上使用。
新版本添加的功能有:
1、無限級多頁采集,可以實(shí)現(xiàn)無限深度的采集
2、任務(wù)隊(duì)列運(yùn)行管理,支持Cron表達(dá)式
3、無限級分組任務(wù)管理,任務(wù)回收站功能
4、RSS地址采集功能
5、列表頁分頁采集獲取功能
6、列表頁附加參數(shù)獲取功能
7、列表頁及標(biāo)簽XPath可視化提取功能
8、標(biāo)簽純正則替換功能
9、Http接口管理采集器運(yùn)行
10、導(dǎo)出記錄為單個(gè)或多個(gè)Txt、html 文件
11、標(biāo)簽間自由組合功能
12、針對標(biāo)簽內(nèi)容繼續(xù)發(fā)送Http請求功能
13、無限級列表網(wǎng)址采集
14、從Http頭信息中獲取數(shù)據(jù)
15、標(biāo)題內(nèi)容正文提取功能
16、Aspx列表分頁自識別
17、多網(wǎng)站站群式web發(fā)布
18、導(dǎo)出記錄為Word格式
19、導(dǎo)出所有記錄為Excel格式
20、使用隨機(jī)二級代理服務(wù)器(支持Socket代理)
21、多擴(kuò)展間數(shù)據(jù)交換功能
22、下載的圖片自動加增強(qiáng)型水印功能
23、Ocr識別(圖片轉(zhuǎn)化為文字)
24、Mongodb數(shù)據(jù)庫保存數(shù)據(jù)
25、主從服務(wù)器分布式采集
26、內(nèi)置瀏覽器Cookie獲取功能增強(qiáng)
27、任務(wù)列表樹支持無限級分組
28、Web發(fā)布和數(shù)據(jù)庫入庫支持插件功能
29、起始網(wǎng)址支持等差等比數(shù)列
修改的功能和修復(fù)的問題限于篇幅問題就不一一列出了。
安裝使用:下載軟件包解壓后直接運(yùn)行 LocoyPlatform.exe啟動軟件,(保證您的電腦安裝有.net2.0框架,vista及win7系統(tǒng)用戶可能會提示請求管理員權(quán)限,請放行)。
升級:若要從3.2sp5,2008,2009或2010版直接升級到火車頭數(shù)據(jù)采集平臺1.0版,請運(yùn)行程序目錄下的 UpdateTo7.0.exe,按提示進(jìn)行升級即可。升級程序不會對原來的數(shù)據(jù)進(jìn)行任何的修改,但為了防止用戶誤操作,請?jiān)谏壡皞浞菖f版本數(shù)據(jù)和配置。備份方法是將原采集器完整復(fù)制一份。
商業(yè)版:商業(yè)版用戶請從商業(yè)用戶通道,會員中心,論壇商業(yè)用戶區(qū)版塊下載到統(tǒng)一的商業(yè)版軟件,使用用戶名或密碼登錄軟件,如果您的升級服務(wù)期限在2012-02-20后,則可以免費(fèi)升級到V7版并使用。
下載鏈接:
【免費(fèi)版】http://www.y5958.cn/Down/LocoySpider/LocoySpiderV7.html?
【商業(yè)版】請登錄會員中心[ http://www.y5958.cn/member/licencemgr.php?]或在論壇商業(yè)用戶區(qū)下載
?