2024年
-
2024-11-05
- 火車采集器V10.26版
-
1.新增:文件上傳支持華為云上傳
2.新增:保存為本地TXT文件時,支持自定義擴展名,比如.ini,.py等等
3.新增:HTML標簽過濾排除支持自定義過濾標簽
4.新增:http請求頭列表支持剪切板批量粘貼導入頭信息設置
5.新增:POST分頁設置支持日期參數(shù)[yyyyMMdd]
6.優(yōu)化:火車采集器默認UA更新
7.優(yōu)化:數(shù)據(jù)編輯SQL操作界面可隨著編輯界面伸縮放大
8.修復:下載圖片探測地址問題修復
9.修復:html標簽過濾時部分標簽不起效問題修復
10.修復:標簽提取結(jié)果生僻字、繁體字不能查看問題修復
11.修復:數(shù)據(jù)獲取中調(diào)用多個標簽作為截取字符不起效問題的修復
12.修復:數(shù)據(jù)轉(zhuǎn)換mysql編碼設置無效問題修復
-
2024-03-18
- 火車采集器V10.25版
-
1.增加:標簽文件下載支持添加圖片水印。
2.增加:數(shù)據(jù)處理中的HTTP請求可以調(diào)用請求頭信息。
3.增加:下載增加是否設置Referer為空配置。
4.增加:批量網(wǎng)址支持文本導入。
5.增加:水印文字可以調(diào)用標簽。
6.增加:獲取cookie超時時間。
7.修復:標簽提取結(jié)果和下載文件名不一致。
8.修復:圖片地址識別錯誤導致下載失敗。
9.修復:列表頁標簽提取結(jié)果有空格時不顯示。
10.修復:正則提取時組合結(jié)果重復。
11.修復:數(shù)據(jù)轉(zhuǎn)換mysql支持修改編碼。
12.優(yōu)化:遠程管理采集數(shù)據(jù)接口優(yōu)化。
13.優(yōu)化:插件.NET Framework升級到4.6。
14.優(yōu)化:網(wǎng)址庫支持手動填寫與選擇。
2023年
-
2023-08-10
- 火車采集器V10.24版
-
1.修復:點擊歡迎頁空白地方頁面打不開。
2.新增:任務批量處理,導入數(shù)據(jù)支持PageUrl字段導入。
3.優(yōu)化:內(nèi)置瀏覽器內(nèi)核升級。
4.修復:起始網(wǎng)址添加向?qū)е信烤W(wǎng)址地址格式顯示錯誤。
5.新增:任務右鍵菜單高級操作增加“標記采集狀態(tài)為已采”。
6.優(yōu)化:遠程管理自動啟動無需在菜單工具欄手動點擊。
7.修復:標簽引用“列表頁”標簽時提取無效。
8.修復:不排重時列表頁重復內(nèi)容被自動過濾。
9.新增:對指定標簽內(nèi)容進行AI對話:http://faq.locoy.com/q-1356.html
10.優(yōu)化:自動更新cookie丟失的請求重新采集。
-
2023-03-10
2022年
-
2022-10-12
- 火車采集器V10.22版
-
1.優(yōu)化:升級內(nèi)置微型瀏覽器內(nèi)核到谷歌瀏覽器
2.優(yōu)化:Win11中部分采集器無法兼容問題修復
3.新增:二級代理支持手動填寫規(guī)則獲取代理列表,可以更靈活獲取多種格式IP
4.新增:加入去除圖片水印功能平臺插件:http://faq.locoy.com/q-1353.html
5.新增:web發(fā)布模塊http頭信息支持選擇生效步驟,提高靈活性,支持更多類型發(fā)布網(wǎng)站
6.修復:部分下載提示未將對象引用至實例
7.修復:循環(huán)時隨機數(shù)據(jù)相關(guān)問題
8.優(yōu)化:部分ssl3最新https網(wǎng)站的相關(guān)兼容性
-
2022-05-30
- 火車采集器V10.21版
-
1.新增:ftp支持七牛云上傳,http://faq.locoy.com/q-1351.html
2.新增:標簽過濾新增內(nèi)容日期過濾,http://faq.locoy.com/q-1352.html
3.新增:文件下載中保存目錄和保存格式增加“[從X開始自增ID]”
4.新增:點擊運行管理列表“狀態(tài)”列可按任務運行狀態(tài)排序,便于排查任務狀態(tài)
5.提升:mysql支持8.0版本
6.修復:批量網(wǎng)址補0預覽無效問題
7.修復:插件管理器文件下載插件模板增加操作方法
8.修復:同url文件再次下載時沒有入庫,導致發(fā)布缺少文件問題
9.修復:設置http請求頭refer時文件探測下載生效,正式下載無效問題
10.修復:web發(fā)布模塊登錄驗證碼顯示不全問題
11.修復:單次替換和批量替換中的“忽略大小寫”設置無效問題
12.修復:勾選數(shù)據(jù)管理“已采”時,更改“已發(fā)”為勾選問題
-
2022-02-28
- 火車采集器V10.2版
-
1.新增:User-Agent支持從文本讀取并隨機切換。教程:http://faq.locoy.com/q-1348.html。
2.新增:自動識別手機號功能支持14、15、16、17、19開頭的新號段。
3.優(yōu)化:文件下載完畢插件接口優(yōu)化。
4.優(yōu)化:探測文件下載時正式下載文件,提升下載速度。
5.修復:http請求頭“Header或設置名”以數(shù)字開頭的名稱報錯的問題修復。
6.修復:發(fā)布到word文檔,如果數(shù)據(jù)包含特殊字符或本地圖片異常會導致發(fā)布失敗問題修復。
7.修復:拷貝任務時,任務備注未拷貝問題修復。
8.修復:標簽引用支持調(diào)用“列表頁”標簽。
9.修復:json提取時如果json對象的“鍵”是整型導致提取有誤。
10.優(yōu)化:網(wǎng)址解析替換html問題。
11.修復:get、post分頁問題處理。
12.修復:生成固定格式的數(shù)據(jù)中“系統(tǒng)時間”選中“06-16”生成時間格式“yyyy-MM”
13.新增:數(shù)據(jù)庫發(fā)布模塊支持replace into語句。
2021年
-
2021-10-08
-
2021-07-05
- 火車采集器V10.0版
-
1.數(shù)據(jù)獲取中支持調(diào)用其他標簽的值作為截取條件。
2.數(shù)據(jù)獲取支持CSS selector,很多網(wǎng)頁的css 的屬性唯一,此功能更利于批量從網(wǎng)頁中提取數(shù)據(jù)。
3.增加關(guān)聯(lián)區(qū)域功能,可以截取網(wǎng)頁中指定區(qū)域內(nèi)容進行采集處理。
4.批量網(wǎng)址增加區(qū)間變化的網(wǎng)址增加方式,適應更多的網(wǎng)頁地址變化方式。
5.批量設置增加新增加功能的批量設置。
6.運行統(tǒng)計日志設置添加默認關(guān)閉功能,可在設置中選擇開啟或關(guān)閉。
7.oss相關(guān)問題修復。
8.網(wǎng)址空格問題導致列表頁標簽錯誤問題修復。
9.下載相關(guān)問題修復。
10.修復“任務數(shù)據(jù)批量處理”中刪除為空記錄無效的問題。
11.文件下載插件增加文件下載后處理接口。
-
2021-03-15
2020年
-
2020-09-07
- 火車采集器V9.21版
-
1: 自動獲取cookie功能優(yōu)化
2: 數(shù)據(jù)庫發(fā)布增加事務,優(yōu)化數(shù)據(jù)庫發(fā)布速度
3: 數(shù)據(jù)轉(zhuǎn)換速度優(yōu)化(針對Mysql和SqlServer數(shù)據(jù)庫的導入), 同時去除網(wǎng)址庫的清空邏輯
4: html標簽處理錯誤問題處理
5: json提取關(guān)于數(shù)字轉(zhuǎn)換為科學計數(shù)法問題處理
6: 發(fā)布測試時,圖片上傳無效的問題處理
7: 采集內(nèi)容頁處理錯誤時,增加對于當前出錯標簽的提示,以便快速定位出錯標簽
8: 任務批量編輯,增加可操作范圍
9: 循環(huán)匹配匹配空格問題處理
10: 刷新分組中增加統(tǒng)計數(shù)據(jù)的刷新
11: post分頁處理
12: 部分功能邏輯優(yōu)化
-
2020-06-15
- 火車采集器V9.20版
-
1: IE瀏覽器內(nèi)核升級
2: Post分頁邏輯優(yōu)化調(diào)整
3: 火車采集器中各個輸入框支持“雙擊”查看詳情,便于操作
4: 下載邏輯對于圖片和附近同時勾選時的邏輯優(yōu)化
5: 圖片探測請求增加對于插件的支持
6: 增加自動更新采集cookie功能來更新cookie以及ua(旗艦(自動授權(quán))及以上版本支持)
7: 發(fā)布模塊在圖片不存在時發(fā)布錯誤的問題修復,以及相應的提示內(nèi)容調(diào)整
8: 將數(shù)據(jù)標記為未采時,同時將圖片下載信息重新標記
9:代理定量設置未生效的bug修復。
-
2020-03-23
2019年
-
2019-12-26
-
2019-11-21
- 火車采集器V9.11版
-
1: 列表頁新增“地址處理”功能
2: 新增“請求失敗數(shù)”的預警條件設置。
3: 下載圖片命名,新增[記錄自增Id]格式
4: 修復圖片下載誤判斷問題
5: 修復計劃任務中“每天調(diào)度”,起始運行時間配置未生效的問題。
6: 修復PHP插件,對于循環(huán)記錄的處理報錯的問題。
7: 修復拼音首字母對于一些錯誤字符的判斷問題。
8: 任務批量編輯,修復“發(fā)布”中“多網(wǎng)站亂序發(fā)布”未能復制的問題
9: 修改“循環(huán)添加新記錄”配置后,修復數(shù)據(jù)格式選擇錯誤的問題。
10:修復循環(huán)記錄中列表頁標簽被多次處理的問題
11:修復對于一些302跳轉(zhuǎn)地址,無法正確跳轉(zhuǎn)的問題。
12:修復一些網(wǎng)址無法正確請求的問題
-
2019-09-05
-
2019-05-07
2018年
-
2018-12-27
-
2018-10-29
- 火車采集器V9.7.1版
-
1: Web發(fā)布模塊,對于登陸數(shù)據(jù),增加自定數(shù)據(jù)的格式。
2: html標簽處理,增加“排除其他標簽”的處理方式。
3: 標簽的編輯,增加“多選”模式,實現(xiàn)批量的復制、刪除操作,按住ctrl鍵,即可選擇多個標簽。
4: 本地數(shù)據(jù)庫為sqlite時,數(shù)據(jù)庫清空時,增加數(shù)據(jù)庫的壓縮操作。
5: 修復采集器長時間行后導致的程序卡頓問題。
6: 當有分頁的時候,對于標簽增加設置提示。
7: 對于Post分頁中的【文本】,增加自定義轉(zhuǎn)義的設置。
8: 修復同步云端規(guī)則,在使用數(shù)據(jù)庫為Mysql或者SqlServer時,未能建立對應規(guī)則本地數(shù)據(jù)庫的問題。
9: 修復循環(huán)匹配與添加為新記錄的沖突問題。
10: 修復當?shù)顷憛?shù)有隨機值,無法自動登陸的問題。
11: 修復使用Python插件時,空格變成+的問題。
12: 修復批量復制下,“最大循環(huán)次數(shù)”未復制的問題,增加起始網(wǎng)址的復制。
13:修復任務、分組無法拖動到根目錄下的問題。
-
2018-07-19
- 火車采集器V9.7版
-
1: 添加“重新采集上次請求失敗的列表頁”功能。
2: 優(yōu)化任務發(fā)布方式,站群式發(fā)布添加支持順序、倒序發(fā)布。
3: 列表頁獨立標簽,增加“從網(wǎng)址中獲取”的選型。
4: 優(yōu)化圖片地址匹配方式,一些原來無法匹配的圖片可以正確匹配了。
5: 同義詞替換,增加對于html標簽替換的支持。
6: 循環(huán)采集模式,增加循環(huán)次數(shù)限制。
7: 數(shù)據(jù)發(fā)布,增加自定義數(shù)據(jù)發(fā)布模式。
8: 修復刪除列表頁時,未能刪除對應列表頁標簽的問題。
9: 修復使用圖片水印時,未選擇保存格式導致的水印錯誤的bug。
10:Json工具,修復長Json處理時的卡頓問題。
11:修復采集標簽過多導致的任務無法運行的錯誤。
12:修復自定義插件編譯錯誤的問題。
13:修復PHP插件對于循環(huán)采集標簽處理時的錯誤問題。
-
2018-04-09
- 火車采集器V9.6.5版
-
1: 文本導出時,增加導出文件的編碼選擇。
2: 批量導入任務以及導入任務分組時,添加任務導入結(jié)果反饋,修復由于一個錯誤任務導致的全部出錯的問題。
3: 批量內(nèi)容替換,增加文本導入的功能。
4: 二級代理自動更換代理優(yōu)化,在無任務使用二級代理時,不進行代理的自動更換。
5: 請求頭信息,增加適用于全部頁面的選擇。
6: HttpPost分頁,添加對于[文本]與[分頁]進行組合的支持。
7: 修復清空網(wǎng)址庫時,對應的壓縮數(shù)據(jù)未能刪除的問題。
8: 修復圖片添加水印時,水印覆蓋錯誤的問題。
9: 修復批量編輯任務時,內(nèi)容頁“其他設置”未能復制的問題。
10:存儲過程sql驗證優(yōu)化,防止一些正確語句被錯誤提示的問題。
-
2018-02-02
-
2018-01-26
- 火車采集器V9.6.3版
-
1: 修復使用PHP插件,無法獲取請求cookie的問題。
2: 批量網(wǎng)址處理中,時間格式增加轉(zhuǎn)換為“時間戳”的功能。
3: 修復“智能提取電話”功能意外變?yōu)椤爸悄芴崛∴]箱”的bug。
4: 無限極列表頁采集,是否由于重復數(shù)據(jù)而停止修改為可配置(原為自動停止采集)。
5: 修復老板鍵設置為空之后,會默認變成 CtrL+Alt的bug。
6: 修復由于沒有水印配置,導致的程序批量復制出錯的問題。
7: 修復由于多頁未能獲取到,導致由多頁獲取數(shù)據(jù)的標簽丟失的bug。
8: 發(fā)布模塊,數(shù)據(jù)庫的編碼增加utf8mb4格式支持。
9: 修復分頁循環(huán)匹配時,組合標簽僅獲取第一頁的bug
10:優(yōu)化批量網(wǎng)址處理中,由于數(shù)據(jù)量太多而導致程序卡頓的問題。
2017年
-
2017-12-12
-
2017-10-26
-
2017-09-09
- 火車采集器V9.6版
-
1: 多級網(wǎng)址列表,對于列表名增加重命名功能以及上下調(diào)整的功能。
2: 修復SqlServer數(shù)據(jù)庫格式下,未能正確顯示采集數(shù)量的問題。
3: 修復在新增標簽時,若上一個編輯為固定格式數(shù)據(jù),則新增的標簽顯示內(nèi)容錯誤的問題。
4: 修復數(shù)據(jù)包登錄中,若登錄失效,未能自動重新登錄的問題。
5: 修復FTP上傳失敗后,本地數(shù)據(jù)也被刪除的問題。
6: 修復邊采集邊發(fā)時,文件上傳FTP失敗的問題。
7: 優(yōu)化Excel保存時,對于ID,PageUrl顯示列的位置。
8: 修復任務不能多選操作的問題。
9: 邊采集邊發(fā)布時,最大發(fā)布數(shù)的功能調(diào)整(原:最大發(fā)布數(shù)無效。 現(xiàn):最大發(fā)布數(shù)生效,且在任務完成后,不會將以前的未發(fā)布數(shù)據(jù)再次發(fā)布)
10:修復對于存儲過程語句,當數(shù)據(jù)為空值時,意外判斷為“語句錯誤”的問題。
11:二級代理功能,修復定時撥號失效的問題。
12:二級代理功能,定時獲取API功能優(yōu)化,重新獲取時,會自動刪除上一批數(shù)據(jù)。
13:批量網(wǎng)址增加數(shù)據(jù)庫導入的模式
14:導出到文件時,對于不合理的錯誤命名增加提示。
15:導出規(guī)則時,對于規(guī)則名稱過長的規(guī)則,增加提示的功能。
16:規(guī)則編輯時,對于“包含”、“不包含”數(shù)據(jù),復制粘貼多行時,會自動區(qū)分為多個數(shù)據(jù)。
17:添加對于芝麻代理的合作支持。
18:數(shù)據(jù)庫導入批量網(wǎng)址
-
2017-06-21
- 火車采集器V9.5版
-
1: 調(diào)整列表頁排重的方式,現(xiàn)在僅會在同級列表頁之間進行排重。
2: 增加對于任務運行完畢之后的運行統(tǒng)計的預警功能(Email郵件預警)【旗艦版功能】
3: 新增支持對于一些請求返回碼不為200時,仍然進行采集的配置。
4: 新增支持將下載地址保存為html文件的功能。
5: 二次代理服務,增加導入的時候配置代理類型,同時修復對于用戶名密碼的顯示錯誤問題。
6: 發(fā)布配置頁面,默認僅顯示當前選擇配置,加快任務加載時間。
7: 修復命令行控制,closeapp參數(shù)無法自動關(guān)閉程序的問題。
8: 修復在未選擇圖片水印時,無法進行圖片剪裁的問題。
9: 優(yōu)化開始界面加載方式,解決初始化界面卡頓的問題。
10:修復在配置多行連接符包含“|”導致的無法探測圖片下載的問題。
11:修復Excel導出數(shù)據(jù)時,列的順序與字段順序不一致的問題。
12:修復Excel導出數(shù)據(jù)時,一些包含數(shù)字的字段的導出數(shù)據(jù)錯誤問題。
13:修復任務批量編輯時,Json采集表達式未能復制的問題。
-
2017-03-02
2016年
-
2016-11-04
-
2016-06-02
2015年
-
2015-12-14
-
2015-09-17
- 火車采集器V9.0版
-
1.全新界面,更好的UI及用戶體驗
2.新架構(gòu)、新內(nèi)核,使用9年的.NET2.0框架升級到.NET4.0框架
3.支持最新的Win10系統(tǒng)中運行
4.二級代理服務器新增Socks代理
5.優(yōu)化采集流程,大幅提升采集及入庫速度
6.任務運行過程中可修改線程數(shù)等參數(shù),實時調(diào)節(jié)運行速度
7.支持SSH(SFTP文件)上傳
8.內(nèi)容提取新增JSON提取方式,提取JSON數(shù)據(jù)更加簡單。
9.新增C#源碼類型插件,可以直接編輯插件源碼,實時生效。
10.軟件閃退,支持保存未完成的任務進度
11.任務運行合并到統(tǒng)一界面,添加“實時數(shù)據(jù)”查看和“任務詳情”統(tǒng)計
12.列表頁,分頁,多頁自定義任意Header請求頭等功能
13.批量修改任務規(guī)則細節(jié)參數(shù),批量修改Web發(fā)布配置
14.起始網(wǎng)址批量網(wǎng)址的地址格式可添加多個地址參數(shù),支持自定義列表參數(shù)
15.標簽數(shù)據(jù)來源更細致化,可設置從默認頁,分頁,多頁的源碼,URL地址及返回頭信息中提取
16.標簽數(shù)據(jù)處理新增統(tǒng)計標簽字符串長度、批量替換功能
17.修改原有的無限級列表頁網(wǎng)址獲取模式,無限級配置更加簡單
-
2015-03-23
2014年
-
2014-12-10
-
2014-06-18
-
2014-04-09
-
2014-02-24