selenium chromedriver 无头浏览器检测_seleium 查看无头浏览器数量-程序员宅基地

技术标签: 爬虫学习  python 爬虫  

JS常用的检测无头浏览器的方法

   1.User-Agent: 最常见的一种判断无头浏览器的方法。

      检查User-Agent。在linux计算机里  Chrome Version 59 无头浏览器的UserAgent 的值是:

      “Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) HeadlessChrome/59.0.3071.115 Safari/537.36”

       于是,检查是否是无头Chrome浏览器:

        # 判断‘HeadlessChrome’字符串是否包含在UserAgent中     

  if (/HeadlessChrome/.test(window.navigator.userAgent)) {

          console.log("chrome headless detected");

          }

      解决方法:

      

{"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36"}

  注: User Agent 也可以从HTTP headers 里获取。然而,这两种情况都容易伪造

 

  2. 插件 Plugins

       navigator.plugins 会返回一个数组,里面是当前浏览器的插件信息。通常,普通Chrome浏览器

       有一些缺省插件,比如Chrome PDF viewer 或 Google Native Client. 相反,在无头模式里,没有

       任何插件,返回的是个空数组。     

  if (navigator.plugins.length == 0) {

         console.log("It may be Chrome headless")

         }

    解决办法:

navigator.plugins=[1,2,3,4,5]  # 方法1
navigator.plugins || [1,2,3,4,5]  # 方法2

   注:也可以替换最终的赋予值(根据实际环境)  

3. 语言

      在谷歌浏览器里,有两个JavaScript属性可以获取当前浏览器的语言设置:

      navigator.language 和 navigator.languages。 第一个是指浏览器界面的语言,后一个返回的是一个数组,

      里面存储的是浏览器用户的所有次选语言。然而,在无头模式里,navigator.languages返回的是个

      空字符串

navigator.language="zh-CN"

   4.  WebGL

        WebGL 提供了一组能在HTML canvas里执行3D渲染的APO.通过这些API.我们可以查询出图形驱动

        的vendor 和 render。

       在 Linux 上的普通谷歌浏览器里,我们获得的renderer 和 vendor 的值为: ‘Google SwiftShader’

       和 ‘Google Inc.’。

       在无头模式里,,我们获得的一个是 ‘MesaOffScreen’ --- 他是没有使用任何 window 系统的

       渲染技术的名称, 和‘ Brian Paul’ ---开源Mesa 图形库的最初的程序。

      var canvas = document.create.createElement('canvas');

      var gl = canvas.getContext('webgl')

      var debugInfo = gl.getExtension('WEBGL_debug_render_info');

      var vendor = gl.getParameter(debugInfo.UNMASKED_VENDOR_WEBGL);

      var renderer = gl.getParameter(debugInfo.UNMASKED_RENDERER_WEBGL);

      if (vendor == 'Brian Pual'  && renderer == "Mesa offScreen") {

         console.log("chrome headless detected");

       }

     注: 并不是所有版本的无头浏览器都有同样的这两个值。然而目前在无头浏览器里是 “MesaOffscreen”

     和 “Brian Pual” 这两个值。

   5. 浏览器特征: Modernizr 可以探测出当前浏览器对HTML和CSS各种特性的支持程度。我发现,普通

       Chrome 和 无头Chrome里唯一的区别是,无头模式下没有hairline特征。 他是用来检测是否支持

       hidpi/retina hairlines的

   6. 加载失败的图片

       检查切入点是检查浏览器不能正常加载图片的宽和高。

       在正常的Chrome里面,未成功加载的图片跟浏览器的zoom有关,但肯定不是零。

       而在无头浏览器里,这中图片的宽和高都是0。

      var body = document.getElementsByTagName("body")[0];

      var image = document.createElement("img");

      image.src = "http://iloveponeydotcom32188.jg";

      image.setAtturibute("id","fakeimage");

      body.appendChild(image);

      image.onerror = function(){

      if (image.width == 0 && image.height == 0){

           console.log(chrome headless detected);

           }

      }

image.length=100;  # 可以使用mitmproxy 在代码中进行替换,为图片指定宽高
image.width=100;

    原文地址: http://www.webhek.com/post/detecting-chrome-headless.html

 

 

   

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_24137739/article/details/92803120

智能推荐

ffmpeg音视频处理流程核心技术_视频效果演示系统的核心技术-程序员宅基地

文章浏览阅读712次。视频播放器原理 什么是ffmpeg? ffmpeg 音视频编/解码 流程图 ffmpeg 常用 struct AVFormatContext AVStream AVCodecContext AVCodec AVPacket AVFrame ffmpeg 常用Api av_register_all() avformat_alloc_output_context2() avio_open()..._视频效果演示系统的核心技术

Java List集合多种情况处理方法_java list reduce-程序员宅基地

文章浏览阅读449次。Java List集合多种情况处理方法:List集合交集、并集、差集、去重、与数组互转、删除、排序等操作_java list reduce

【UML】软件需求说明书_uml需求文档访客管家-程序员宅基地

文章浏览阅读2.3k次,点赞77次,收藏80次。需求:指人对客观事务需要的表现,体现为愿望、意向和兴趣,因而成为行动的一种直接原因。软件需求(IEEE软件工程标准词汇表):(1)用户解决问题或达到目标所需的条件或能力。(2)系统或系统部件要满足合同、标准、规范或者其他正式规定文档所需具有条 件或能力。(3)对(1)或(2)中的一个条件或一种能力的一种文档化表述。用例:定义 1 用例是对一个活动者使用一个系统的一项功能时进行交互过程中的一个文字描述序列。_uml需求文档访客管家

linux笔记-根文件系统及文件管理命令详解_根文件系统文本登陆-程序员宅基地

文章浏览阅读574次。第三章、Linux根文件系统及文件管理命令详解02_03_Linux根文件系统详解文件系统:rootfs: 根文件系统 FHS:Filesystem Hierarchy Standard(文件系统目录标准)的缩写,多数Linux版本采用这种文件组织形式,类似于Windows操作系统中c盘的文件目录,FHS采用树形结构组织文件。FHS定_根文件系统文本登陆

马克 · 扎克伯格期望的元宇宙到底会是什么样子?_马克扎克伯格博客-程序员宅基地

文章浏览阅读358次。马克 · 扎克伯格期望的元宇宙到底会是什么样子?_马克扎克伯格博客

使用Python开发游戏运行脚本(二)实现模拟点击_大漠窗口绑定成功按键-程序员宅基地

文章浏览阅读1.4w次,点赞8次,收藏78次。本文接上一篇文章 使用Python开发游戏运行脚本(一)成功调用大漠插件上一篇我们已经简单实现了python调用大漠插件并输出版本号的功能,接下来我们要做的就是通过大漠插件模拟鼠标点击和键盘文字输入。 由于近年来最热门的游戏基本都是手游,所以我们也会以手游为例来进行游戏脚本的开发。大漠插件是一款针对Windows平台的鼠标键盘模拟+图文查找库,这样我们要想实现手游脚本开发的第一步,就是下载Android模拟器,然后在对安卓模拟器进行鼠标和键盘的模拟,以此来实现自动化游戏脚本。一、Android模拟器的_大漠窗口绑定成功按键

随便推点

Canvas实现黑客帝国字符雨_canvas画字符雨-程序员宅基地

文章浏览阅读1k次。 利用Canvas的fillText(),隔一定时间在画布上作画<!DOCTYPE html><head> <meta charset="utf-8"> <meta name="viewport" content="width=device-width,initial-scale=1.0"> &_canvas画字符雨

微信公众号跳转微信小程序,自定义微信跳转标签_opentaglist-程序员宅基地

文章浏览阅读1.1k次。微信公众号跳转微信小程序,自定义微信跳转标签_opentaglist

数据恢复技术与LVM数据恢复方法_vgreduce --removemissing恢复-程序员宅基地

文章浏览阅读4.3k次。数据恢复技术与LVM数据恢复方法 1摘要 随着计算机网络应用的发展,数据存储的安全性变的越来越重要。在常见的基于RAID和LVM的环境下面,当出现硬盘故障或者错误操作导致数据丢失的情况下,采用适当的数据恢复策略可以在很大程度上提供数据恢复的成功概率。本文研究了几种情况下的数据恢复技术和方法,为数据恢复和数据安全的预防提供了指导。 2数据恢复需求 2.1Linux IO存储栈 图(1)Linux IO 存储..._vgreduce --removemissing恢复

程序员如何年薪百万?深度学习必读书籍!_年薪百万的程序员看什么书-程序员宅基地

文章浏览阅读307次。深度学习程序员想年薪百万,基础必须打牢,所以推荐重点书籍Deep Learning花书Deep Learning with PythonDeep Learning for Computer Vision with PythonScikit-Learn与TensorFLow机器学习实用指南深度学习实践Tensorflow机器学习指南..._年薪百万的程序员看什么书

Window系统下C/C++程序毫秒和微秒级程序运行时间的获取方法_large_integer nfreq, t1, t2;-程序员宅基地

文章浏览阅读1.3k次。一、使用clock()函数,获取毫秒级(ms)时间[1]#include <time.h>//clock()头文件clock_t start = clock();{statement section}//测试代码段clock_t end = clock();printf("the running time is :%fs\n", (double)(end -s..._large_integer nfreq, t1, t2;

IntelliJ IDEA 使用教程-- 从入门到上瘾(配套视频教程)_idea使用视频教程-程序员宅基地

文章浏览阅读6.8k次,点赞3次,收藏31次。 前言: 至于用哪个开发工具本文暂且不做任何讨论, 今天着重讲解IntelliJ IDEA这款开发工具的使用 前言:IntelliJ IDEA如果说IntelliJ IDEA是一款现代化智能开发工具的话,Eclipse则称得上是石器时代的东西了。其实笔者也是一枚从Eclipse转IDEA的探索者,随着近期的不断开发实践和调试,逐步..._idea使用视频教程

推荐文章

热门文章

相关标签