抓取網(wǎng)頁數(shù)據(jù)工具火車采集器V9是市場中功能最全面的采集軟件,具備數(shù)據(jù)采集、處理和發(fā)布功能,能夠輕松應對網(wǎng)站更新維護、內(nèi)容群發(fā)等需求。采集完發(fā)布大家一定都會操作了,但是如果你已經(jīng)有了一批數(shù)據(jù),不需要再進行采集,只需要發(fā)布該怎么通過火車采集器來實現(xiàn)呢?
其實這個需求也是很容易實現(xiàn)的,大家可以按照以下步驟來進行:
1、首先是新建一個任務,這步操作會產(chǎn)生一個任務數(shù)據(jù)庫,然后將自己已有的數(shù)據(jù)導入到這個數(shù)據(jù)庫中。當然,這個任務你需要設置發(fā)布步驟,否則無法實現(xiàn)發(fā)布。
2、在任務數(shù)據(jù)庫中,將已采設置為true或1,mysql,sqlserver是1。
3、開始運行任務,在火車采集器最新版V9里面不需要勾選采集,在其他版本中不需要勾選采網(wǎng)址和采內(nèi)容,只勾選發(fā)內(nèi)容即可。
有的用戶反映說,抓取網(wǎng)頁數(shù)據(jù)工具火車采集器會重復發(fā)布文章,也就是說發(fā)布到網(wǎng)站后,下一次運行時又接著發(fā)布,導致網(wǎng)站上內(nèi)容重復。對于這個問題,我們需要從以下兩點著手考慮:
1、采集器是否采集了多篇一樣的文章內(nèi)容? 可以通過,右擊規(guī)則——本地編輯數(shù)據(jù)來查看采集的數(shù)據(jù)。
2、采集器發(fā)布的時候,是否提示了發(fā)布成功? 如果您發(fā)布的時候提示的是 “發(fā)布未知” 或者“發(fā)布失敗” ,而實際上您的內(nèi)容確實是已經(jīng)成功發(fā)布到您的網(wǎng)站了。那么這個狀態(tài)下,采集器不會把內(nèi)容標記為已發(fā)狀態(tài),下次發(fā)布的時候,還是會作為新內(nèi)容去發(fā)布的。所以才會出現(xiàn)部分用戶看到的重復發(fā)布的問題。
針對上面的問題,解決方案如下:
1、如果是發(fā)布的內(nèi)容有的顯示成功,有的顯示未知,那么考慮調(diào)整下發(fā)布時間間隔,間隔設置長一些,然后再運行發(fā)布試試,關于如何設置線程可參考官網(wǎng)教程。
2、如果上面方法仍然解決不了問題,那么可以考慮強制解決辦法,在文件保存及部分高級設置的右下角發(fā)布結束后,勾選標記所有記錄為已發(fā),這樣每次發(fā)布無論發(fā)布結果如何提示,都會把這條記錄標識為已經(jīng)發(fā)布。
抓取網(wǎng)頁數(shù)據(jù)工具火車采集器V9對于采集、處理、發(fā)布均能進行高效的操作,學會靈活運用能夠為我們的日常工作和學習帶來極大的便利。