• <xmp id="ei4ks">
  • <td id="ei4ks"></td>
  • 注冊
    閩南網 > 新聞中心 > 消費主張 > 正文

    低價票難搶或被爬蟲吃了 2018年春運航空票搶票太難

    來源:科技日報 2017-12-27 09:16 http://www.vistrails.com/

      不到兩個月,2018年春節要來了。

      “今年我得早下手,搶張回家的低價機票。”在北京打工的小王對科技日報記者說,由于老家在云南,春節機票太貴,他都選擇坐兩天兩夜的火車回去,長途跋涉,苦不堪言。

      然而,就在小王摩拳擦掌,準備使出“洪荒之力”搶張便宜機票時,看到網上曝出這樣一則消息:航空公司放出的低價機票,80%以上被票務公司的“爬蟲”搶走,普通用戶很少能買到。

      小王傻眼了,“爬蟲”究竟是什么鬼?它又是怎么搶機票的?難道就沒有辦法治理嗎?

      借助超鏈接信息抓取網頁

      “‘爬蟲’技術是實現網頁信息采集的關鍵技術之一,通俗來說,‘爬蟲’就是一段用來批量、自動化采集網站數據的程序,幾乎不需要人工干預。”北京理工大學網絡科學與技術研究院副教授閆懷志告訴科技日報記者。

      閆懷志介紹,“爬蟲”又稱網頁“蜘蛛”、網絡機器人,它是一種按照一定規則自動抓取網頁信息的程序或者腳本,通常駐留在服務器上。在Web網頁中,既包含可供用戶閱讀的文字、圖片等信息,還包含一些超鏈接信息。網絡“爬蟲”正是借助這些超鏈接信息來不斷抓取網絡上的其他網頁。

      “這種信息采集過程很像一個爬蟲或蜘蛛在網絡上漫游,網絡‘爬蟲’或網頁‘蜘蛛’因此得名。”閆懷志說,“爬蟲”最早應用在搜索引擎領域,比如谷歌、百度、搜狗等搜索引擎工具每天需要抓取互聯網上數百億的網頁,它們需要借助龐大的“爬蟲”集群來實現搜索功能。

      當前,“爬蟲”已被廣泛用于電子商務、互聯網金融等諸多領域。比如,“爬蟲”可以抓取航空公司官網的機票價格,發現低價或緊俏機票后,“爬蟲”可以利用虛假客源的真實身份信息實現搶先預訂。再有,很多互聯網瀏覽器都推出了自己的搶票插件,以高訂票成功率來推廣瀏覽器。

      根據抓取任務和目標的不同,網絡“爬蟲”可大致分為批量型、增量型和垂直型。批量型“爬蟲”的抓取范圍和目標較為明確,可以是網頁的設定數量,也可以是消耗時間的設定。增量型“爬蟲”主要用于持續抓取更新的網頁,以適應網頁的不斷變化。垂直型“爬蟲”主要是用于特定主題內容或特定行業的網頁。

    相關閱讀:
    新聞 娛樂 福建 泉州 漳州 廈門
    猜你喜歡:
    熱門評論:
    頻道推薦
  • 記者手記丨加征關稅能重振美國制造業?美民
  • 智慧綠色雙輪驅動 粵港澳大灣區港口持續向
  • 市場監管總局通報民用“三表”專項檢查結果
  • 新聞推薦
    @所有人 多項民生禮包加速落地快來查收 三峽大壩變形?專家:又有人在惡意炒作 北京新一波疫情為什么沒出現死亡病例? 戴口罩、一米線 疫情改變了哪些習慣? 呼倫貝爾現幻日奇觀 彩虹光帶環繞太陽
    視覺焦點
    石獅:秋風起,紫菜香 石獅:秋風起,紫菜香
    石獅環灣生態公園內粉黛亂子草盛放 石獅環灣生態公園內粉黛亂子草盛放
    精彩視頻
    鄭和開麥喊話:來不來泉州臺商投資區,look in my eyes!回答我?。?!
    鄭和開麥喊話:來不來泉州臺商投資區,look in my eyes!回答我?。?!
    第26屆中國(晉江)國際鞋業暨第九屆國際體育產業博覽會隆重開幕(視頻)
    第26屆中國(晉江)國際鞋業暨第九屆國際體育產業博覽會隆重開幕(視頻)
    專題推薦
    關注泉城養老服務 打造幸福老年生活
    關注泉城養老服務 打造幸福老年生活

    閩南網推出專題報道,以圖、文、視頻等形式,展現泉州在補齊養老事業短板,提升養老服

    新征程,再出發——聚焦2021年全國兩會
    2020福建高考招錄
     
    48小時點擊排行榜
    以下哪種傳統技藝與“宮毯”有關?螞蟻新 螞蟻莊園今日答案最新:我國古代小說《儒 螞蟻莊園今天問題正確答案:鉛筆上通常會 “五一”假期全省文旅紅火平安有序 累計 福建省首個海岸煙花文旅地標單日吸引客流 連城:“5A+非遺”點亮文旅新熱潮 紅色小鎮人潮涌 今天(5月6日)油價調整最新消息:油價跌
    国产啊v免费在线观看_亚洲天堂无码免费在线观看_亚洲av超清无码不卡在线观看_中文字幕亚洲欧美日韩专区