火車采集器免費(fèi)版(LocoySpider)是一款專業(yè)的功能強(qiáng)大的網(wǎng)絡(luò)數(shù)據(jù)/信息挖掘軟件。火車采集器免費(fèi)版(LocoySpider)通過靈活的配置,您可以很輕松的從網(wǎng)頁上抓取文字、圖片、文件等任何資源。
更新日志
新增功能:
數(shù)據(jù)處理新增人工智能 DeepSeek。
JSON 提取數(shù)據(jù)支持任意層級數(shù)據(jù)提取。
Web 發(fā)布支持批量域名添加。
針對部分 HTTPS 地址不能訪問,增加了第三方服務(wù)。
水印轉(zhuǎn)換圖片格式支持 WebP 格式。
邊采集邊發(fā)布新增發(fā)布失敗標(biāo)記未采選項。
優(yōu)化改進(jìn):
優(yōu)化了超多任務(wù)同時運(yùn)行造成客戶端卡頓的部分情況。
拼音簡繁轉(zhuǎn)換升級優(yōu)化。
表格智能提取數(shù)據(jù)支持分隔符連接。
修復(fù)問題:
修復(fù)了自動分詞數(shù)字和英文問題。
軟件特色
分布式高速采集
任務(wù)分配至多個客戶端,同時運(yùn)行采集,效率倍增。
多識別系統(tǒng)
配備正文識別、中文分詞識別、任意編碼識別等多種識別系統(tǒng),智能識別操作更輕松。
可選驗(yàn)證方式
可選擇是否使用加密狗,隨時保障數(shù)據(jù)安全。
全自動運(yùn)行
無需人工值守操作,任務(wù)完成后自動關(guān)機(jī)。
替換功能
同義,近義詞替換、參數(shù)替換,偽原創(chuàng)必備技能。
任意文件格式下載
圖片、壓縮文件、視頻等任意格式的文件都能輕松下載。
采集監(jiān)控系統(tǒng)
實(shí)時監(jiān)控采集,確保數(shù)據(jù)的準(zhǔn)確性。
支持多數(shù)據(jù)庫
支持Access/MySQL/MsSQL/Sqlite/Oracle多種類型的數(shù)據(jù)庫保存及發(fā)布。
無限級多頁采集
支持包含ajax請求數(shù)據(jù)在內(nèi)的多個頁面信息的無限級采集。
支持?jǐn)U展
支持接口和插件擴(kuò)展,滿足各種采發(fā)需求。
功能介紹
真正通用
采集不限網(wǎng)頁,不限內(nèi)容,支持多種擴(kuò)展,打破操作局限。采什么,如何采,都由您決定!
高效穩(wěn)定
分布式高速采集系統(tǒng),多個大型服務(wù)端同時穩(wěn)定運(yùn)作,快速分解任務(wù)量,最大化提升效率。
性價比高
高性能的產(chǎn)品,搭配親民的價格,“為客戶節(jié)約成本,提升價值”是火車采集器的服務(wù)理念。
數(shù)據(jù)精準(zhǔn)
內(nèi)置采集監(jiān)控系統(tǒng),實(shí)時報錯及時修復(fù);采集發(fā)布時確保數(shù)據(jù)零遺漏,為用戶呈現(xiàn)最精準(zhǔn)的數(shù)據(jù)。
FAQ
登錄信息設(shè)置: 對于部分需要登錄的網(wǎng)站,需要設(shè)置此項。

點(diǎn)擊 點(diǎn)擊設(shè)置 按鈕,跳轉(zhuǎn)到第四步其他設(shè)置——Http請求設(shè)置

點(diǎn)擊 使用瀏覽器獲取網(wǎng)頁登錄信息 按鈕,登錄網(wǎng)址,輸入賬號密碼后,再關(guān)閉窗口即可

這樣登錄信息就已經(jīng)記錄在采集器里了,就是我們常說的 Cookie 和 User-Agent 。
安裝步驟
一、在本站下載火車采集器最新版,雙擊運(yùn)行。


二、如下圖,可以點(diǎn)擊【瀏覽】設(shè)置軟件的安裝位置。

三、設(shè)置完畢點(diǎn)擊【安裝】,耐心等待即可。

使用技巧
起始網(wǎng)址設(shè)置。
采集規(guī)則制作的第一步驟,點(diǎn)擊向?qū)砑?,?②,出現(xiàn)如圖界面。
分3種方式:普通網(wǎng)址,批量網(wǎng)址,文本導(dǎo)入。

a、普通網(wǎng)址:以一行一個的形式直接加入網(wǎng)址,不做任何解析。
b、批量網(wǎng)址:以通用的表達(dá)式批量生成網(wǎng)址。
c、文本導(dǎo)入:以文本導(dǎo)入的形式,文本為一行一個的網(wǎng)址。