当前位置:经济频道首页 > 经济要闻 > 正文

“爬虫”如何抢低价票?借助超链接信息抓取网页(2)

2017-12-27 17:37:58    科技日报  参与评论()人

“爬虫”究竟是如何抢票的

此前,在线票务服务公司携程的“反爬虫”专家在技术分享中透露,某网站的一个页面,每分钟的浏览量是1.2万,真实用户只有500个,“爬虫”流量占比为95.8%。

采访中,很多业内人士也表示,即使在“爬虫”活动的淡季,虚假流量也占到订票网站总流量的50%,高峰期更是在90%以上。

那么,“爬虫”究竟是如何实现抢票的呢?对此,闫怀志解释,主要是机票代理公司利用“爬虫”技术,不断抓取航空公司售票官网网页信息,如果发现该航空公司有低价票放出,“爬虫”即刻利用虚假客源身份进行批量预定但不实际支付,以达到抢占低价票源的目的。由于“爬虫”的效率远远超过正常的手动操作,导致通过正常操作几乎无法抢到票。

随后,机票代理公司会通过其自身销售渠道(包括公司网站、在线旅行社、客户电话订购等)找到真正的客源,在航空公司允许的账期内,退订此前使用虚假客源身份预定的低价票,然后使用真实身份信息进行订购,最后实现该低价票的加价转售。

如果未在航空公司规定的账期内找到真正客源,机票代理公司会在订单失效前再追加虚假身份订单,继续“霸占”该低价票,如此反复,直至找到真正客源售出为止。

“上面的操作流程就构成了完整的机票销售链条。在这个过程中,航空公司售票系统允许在账期内反复订、退票的规定为机票代理公司利用‘爬虫’抢票并加价获利提供便利。这种抢票方式,被称为技术‘黄牛’。”闫怀志强调。

的确,有业内人士表示,这些“爬虫”流量消耗了大量的机器资源,却不产生任何消费,这是每个公司最痛恨的东西。但是,因为怕误伤真实用户,各家公司的“反爬虫”策略做得非常谨慎。

采用一定手段 “爬虫”可防可控

任何事情都有两面,“爬虫”技术也不例外。

在闫怀志看来,“爬虫”既可为正常的数据批量获取提供有效的技术手段,也可被恶意使用以获取不当利益。如果“爬虫”技术被不正当利用,就会带来一定的危害。

首先,威胁数据安全。航空公司售票网站数据被恶意爬取,数据可能会被机票代理公司恶意利用,而且还存在被同业竞争对手获取的风险。

其次,导致系统性能下降,影响用户体验。“爬虫”大量的抓取请求会导致航空公司售票网站服务器资源负载上升、性能下降,网站响应变慢甚至无法提供服务,对用户搜索和交易体验造成负面影响。但由于存在巨大的灰色利益空间,同时“反爬虫”技术在与“爬虫”对抗中作用有限,使得这种显失公平的“作弊”方式成为扰乱机票市场秩序的技术“顽疾”。

为您推荐: