selenium滑块解锁实现的研究

滑块解锁

该问题主要源于各个平台的登录验证或者针对爬虫或selenium的一种防范手段。由于各个网站的防爬技术的提高,常规selenium似乎无法通过滑块验证,以下提供普遍的滑块验证思路,以供参考:

  • 获取滑块本身的元素以及滑块所在长条的元素
  • 根据滑块元素的size和所在矩形元素的size便能得到滑块的偏移量
  • 使用selenium库中的actionChains中的click_and_holemove_by_offset来控制滑块行动
代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
根据滑块本身的大小以及承载滑块的div的大小来获取偏移量offx
    slide1_back = self.find_ele_is_presence(_slide1_back_locate)
    slide1_span = self.find_ele_is_presence(_slide1_span_locate)
    获取滑块的起始坐标location
    start_location = slide1_span.location
    # 获取滑块所在长条的长宽大小
    background_size = slide1_back.size
    4.滑块的滑动范围[开始位置的横坐标减去滑片的宽度],由于是平移所以纵坐标没有变化
    x_location = background_size["width"] - start_location["x"]
    y_location = start_location["y"]
  • 然后通过对滑动轨迹:即一定时间内滑动的偏移量的变化,来模拟真人操作,试图通过检测
代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
def ease_out_quad(x):
    return 1 - (1 - x) * (1 - x)

def ease_out_quart(x):
return 1 - pow(1 - x, 4)

def ease_out_expo(x):
if x == 1:
return 1
else:
return 1 - pow(2, -10 * x)

def get_tracks(distance, seconds):
"""
:param distance: offset
:param seconds: 拉动时间
:return:
"""
tracks = [0]
offsets = [0]
# print("np_value:", np.arange(0.0, seconds, 0.1))
for t in np.arange(0.0, seconds, 0.1):
offset = round(ease_out_quart(t / seconds) * distance)
tracks.append(offset - offsets[-1])
offsets.append(offset)
return offsets, tracks

结论

遗憾的是,有些网站的滑块检测条件极为苛刻又难以捉摸,即使使用了随机暂停,加速度变化等操作来模拟真人滑动,还是无法通过检测。疑似要通过人工智能的方式来解决。

浏览器页面滚动

使用JS进行滚动

因为一般滚动条都不作为单独的元件出现,而是附庸在某个divtable上,当这些元件展示内容过多时便会自动出现滚动条,所以难以通过selenium定位然后actionChains调用方法进行拖拽的方式控制页面滚动,需要通过JS来完成对滚动条的操作。

常见JS

  • 针对整个页面进行滚动
代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
def test_scroll_to():
chromeOptions = webdriver.ChromeOptions()
chromeOptions.add_argument('--start-maximized')
driver = webdriver.Chrome(chromeOptions)

driver.get('https://www.jd.com/')
n=1
while True:
    # driver.execute_script(f"document.body.scrollTop = {100*n};")
    driver.execute_script(f"window.scrollTo({(n-1)*50}, {n*50})")
    n+=1</code></pre></div></div><ul class="ul-level-0"><li>针对单个元素的内嵌滚动条进行滚动</li></ul><div class="rno-markdown-code"><div class="rno-markdown-code-toolbar"><div class="rno-markdown-code-toolbar-info"><div class="rno-markdown-code-toolbar-item is-type"><span class="is-m-hidden">代码语言:</span>python</div><div class="rno-markdown-code-toolbar-item is-num"><i class="icon-code"></i><span class="is-m-hidden">代码</span>运行次数:<!-- -->0</div></div><div class="rno-markdown-code-toolbar-opt"><div class="rno-markdown-code-toolbar-copy"><i class="icon-copy"></i><span class="is-m-hidden">复制</span></div><button class="rno-markdown-code-toolbar-run"><i class="icon-run"></i><span class="is-m-hidden">Cloud Studio</span> 代码运行</button></div></div><div class="developer-code-block"><pre class="prism-token token line-numbers language-python"><code class="language-python" style="margin-left:0"></code></pre></div></div><p>document.querySelector(&#39;.page-content&#39;).scrollTo(0,300)</p><p>document.querySelector(&#39;.ant-table-content&#39;).scrollTo(-100,0)</p><p>通过定位到存在内嵌滚动条的元件,然后使用scrollTo(x,y)进行滚动。</p>