WebDriver

本规范派生自流行的 Selenium WebDriver 浏览器自动化框架。 Selenium 是一个长期存在的项目，由于其历史悠久且使用范围广泛，它具有范围广泛的预期功能。本规范利用这些预期来指导其设计。在作出改进或澄清之处，均谨慎进行，以允许 Selenium WebDriver 的现有用户避免意外的破坏。

本规范预期的最大用户群体是编写自动化测试和其他工具的软件开发人员和测试人员，例如依赖于自动化浏览器的监控或负载测试。因此，本规范谨慎地提供了命令，以简化常见任务，例如向元素输入以及点击元素。

WebDriver 提供了一种机制，供其他人定义协议扩展，以自动化那些无法完全在 ECMAScript 中实现的功能。这允许其他 Web 标准支持新平台特性的自动化。它还允许供应商公开其浏览器特有的功能。

除标记为非规范性的章节外，本规范中的所有创作指南、图表、示例和注释也都是非规范性的。本规范中的其他所有内容都是规范性的。

以算法或具体步骤表述的一致性要求可以用任何方式实现，只要最终结果等效即可。本文档中的算法通常以可读性为考量编写，而非以性能为考量。

在等式中，所有数字都是整数，加法由 “+” 表示，减法由 “−” 表示，除法由 “÷” 表示，按位或由 “|” 表示。字符 “(” 和 “)” 在这些上下文中用于提供逻辑分组。

数学函数 min(value, value[, value]) 返回两个或更多值中的最小项。反之，函数 max(value, value[, value]) 返回两个或更多值中的最大项。

数学函数 floor(value) 产生不大于 value 的、最接近正无穷大的最大整数。

通用唯一标识符（UUID）是一个 128 位长的 URN，不需要中心化注册过程。生成 UUID 是指 从真正随机数或伪随机数创建 UUID，并将其转换为字符串表示。 [RFC4122]

Unix Epoch 是一个近似表示自 Epoch 以来已经过秒数的值，如 The Open Group Base Specifications Issue 7 第 4.15 节（IEEE Std 1003.1）所述。

整数是一个在 Number，其在 ToInteger 操作下保持不变。

ECMAScript 属性的初始值是平台为该属性定义的值，即在不存在任何内容脚本遮蔽的情况下它会具有的值。

浏览器 chrome 是一个非规范性术语，指用户与用户代理本身交互所通过的表示，区别于被访问的 Web 内容。浏览器 chrome 元素的示例包括但不限于：工具栏（例如书签工具栏）、菜单（例如文件菜单或上下文菜单）、按钮（例如后退和前进按钮）、门挂件（例如安全和证书指示器），以及装饰（例如操作系统小部件边框）。

当用户代理处于远程控制之下时， webdriver-active 标志被设为 true。它最初为 false。

WebIDLinterface mixin NavigatorAutomationInformation {
  readonly attribute boolean webdriver;
};
Navigator includes NavigatorAutomationInformation;

注

NavigatorAutomationInformation 接口不应在 WorkerNavigator 上暴露。

webdriver: 如果webdriver-active 标志已设置，则返回 true，否则返回 false。

WebDriver 协议由以下各方之间的通信组成：

本地端: 本地端表示协议的客户端侧，通常以特定于语言的库的形式存在，这些库在 WebDriver 协议之上提供 API。本规范不对这些库在有线协议层级之上的细节设置任何限制。
远程端: 远程端托管协议的服务器侧。定义远程端响应 WebDriver 协议的行为构成了本规范的最大部分。

对于远程端，该标准定义了两个宽泛的一致性类，称为节点类型：

中介节点: 中介节点是充当代理的节点，同时实现本地端和远程端的协议。但是，它们不被期望直接实现远程端步骤。位于特定中介节点与端点节点之间的节点被称为位于该端点节点的上游。
端点节点: 端点节点是节点链中最终的远程端，且不是中介节点。端点节点由用户代理或类似程序实现。

从本地端的角度来看，所有远程端节点类型都必须与远程端在黑盒上不可区分，因而在有线协议方面受远程端要求的约束。

远程端的就绪状态指示它是否可接受新连接。如果实现是端点节点，且活动 HTTP 会话列表不为空，则它必须为 false；或者如果已知该远程端处于尝试创建新会话会失败的状态，也必须为 false。在所有其他情况下，它必须为 true。

如果中介节点是一个管理多个端点节点的多路复用器，则这可能表明其提供更多会话的能力，例如当它已达到其最大容量时。

WebDriver 远程端必须提供一个HTTP 合规的有线协议，其中端点映射到不同的命令。

由于本标准只定义远程端协议，因此它不要求本地端应如何实现。本地端只被期望在能够使用远程端协议通信的范围内兼容；对其暴露的面向用户的 API 不提出任何要求。

本规范的各个部分以逐步算法的形式编写。这些算法的细节不具有任何规范性意义；实现可以自由采用任何实现策略，只要其产生与规范等效的输出即可。特别是，本文档中的算法针对可读性而非性能进行了优化。

在返回值的算法可能失败的情况下，它们被写成返回成功或错误。成功值具有关联的 data 字段，其中封装了返回的值，而错误值具有关联的错误码。

当调用可能失败的算法时，构造 “Let result be the result of trying to call algorithm” 等价于

令 temp 为调用 algorithm 的结果。
如果 temp 是错误，则返回 temp；否则令 result 为 temp 的 data 字段。

使用 name 从 object 获取属性的结果，定义为与在 object 上调用 Object.[[GetOwnProperty]](name) 的结果相同。

使用参数 name 和 default 从 object 获取带默认值的属性的结果，定义为：如果在 object 上调用 Object.[[GetOwnProperty]](name) 得到的结果不是 undefined，则为该结果；否则为 default。

使用参数 name 和 value 在 object 上设置属性，定义为与在 object 上调用 Object.[[Put]](name, value) 相同。

对 JSON Object 类型的 object 进行 JSON 序列化的结果，定义为调用 stringify(object) 的结果。

使用 text 进行 JSON 反序列化的结果定义为调用 parse(text) 的结果。

WebDriver 协议被组织为命令。本规范中定义了方法和模板的每个 HTTP 请求都表示一个单独的命令，因此每个命令都会产生一个单独的HTTP 响应。

响应一个命令时，远程端将运行一系列操作，称为远程端步骤。这些步骤提供了远程端在接收到特定命令时所采取的操作序列。

远程端是一个 HTTP 服务器，从客户端读取请求并写入响应，通常通过 TCP 套接字进行。为了本规范的目的，我们将特定本地端和远程端之间的数据传输建模为一个连接，远程端可以向该连接写入字节和读取字节。但是，该连接如何工作以及如何建立的确切细节不在范围内。

在连接建立后，远程端必须运行以下步骤：

当while 该连接尚未关闭时：
1. 从连接读取字节，直到可以从数据构造出一个完整的HTTP 请求。令 request 为一个根据 [RFC7230] 的要求，从接收到的数据构造出的请求。如果无法构造完整的HTTP 请求，则远程端必须关闭该连接，或返回状态码为 500 的 HTTP 响应，或返回一个错误，其错误码为unknown error。
2. 令 request match 为以 request 的 method 和 URL 作为参数，运行匹配请求算法的结果。
3. 如果 request match 的类型为错误，则使用 request match 的错误码发送错误，并continue。
  
  否则，令 command 和 URL variables 为 request match 的数据。
4. 令 session 为 null。
5. 如果 URL variables contains "session id"：
  
  注
  
  此条件旨在排除新建会话和状态命令，以及任何不操作特定会话的扩展命令。
  1. 令 session id 为 URL variables["session id"]。
  2. 对于活动会话列表中的每个 active session：
    1. 如果 active session 的会话 ID等于 session id，则令 session 为 active session，并跳出循环。
  3. 如果 session 为null，则使用错误码 invalid session id 发送错误，然后continue。
6. 将一个任务加入远程端的请求队列，以运行以下步骤：
  1. 如果会话不再位于活动会话列表中，则发送错误，其错误代码为无效会话 ID，并返回。
  2. 令 parameters 为null。
  3. 如果 request 的method 是 POST：
    1. 令 parse result 为以 request 的 body 作为参数，解析为 JSON的结果。如果此过程抛出异常，则返回一个错误，其错误码为 invalid argument，并跳回整个算法中的步骤 1。
    2. 如果 parse result 不是Object，则使用错误码 invalid argument 发送错误并跳回整个算法中的步骤 1。
      
      否则，令 parameters 为 parse result。
  4. 令 navigate result 为以 session 调用等待导航完成的结果。
  5. 如果 navigate result 是错误，则使用等于 navigate result 的错误码的错误码发送错误并返回。
  6. 令 response result 为使用 session、URL variables 和 parameters 为 command 运行远程端步骤所获得的返回值。
  7. 如果 response result 是错误，则使用等于 response result 的错误码的错误码发送错误并返回。
  8. 断言：response result 是成功。
  9. 令 response data 为 response result 的 data。
  10. 以状态 200 和 response data 发送响应。

当被要求使用 error code 和可选的 error data 字典发送错误时，远程端必须运行以下步骤：

令 status 和 name 为 error code 对应的错误响应数据。
令 message 为实现定义的字符串，其中包含对错误原因的人类可读描述。
令 stacktrace 为实现定义的字符串，其中包含错误发生时活动栈帧的栈跟踪报告。

令 body 为一个新的 JSON Object，并用以下属性初始化：

"error"

name

"message"

message

"stacktrace"

stacktrace
如果错误数据字典包含任何条目，则将 body 上的 "data" 字段设置为一个新的 JSON Object，并使用该字典填充。
以 status 和 body 作为参数发送响应。

当被要求使用参数 status 和 data 发送响应时，远程端必须运行以下步骤：

令 response 为一个新的响应。
将 response 的HTTP 状态设置为 status，并将状态消息设置为在状态码注册表中对应于 status 描述的字符串。
使用以下值设置 response 的标头的名称和值：

Content-Type

"application/json; charset=utf-8"

Cache-Control

"no-cache"
令 response 的body 为一个 JSON Object 的 UTF-8 编码后的JSON 序列化结果，该 Object 带有一个键 "value"，其值设置为 data。
令 response bytes 为根据 [RFC7230] 中的规则序列化 response 所得到的字节序列。
将 response bytes 写入到连接。

请求路由是从一个HTTP 请求到实现该请求所表示的命令所需的一系列步骤的过程。

远程端具有关联的 URL 前缀，它用作该远程端上所有 WebDriver 定义的 URL 的前缀。这必须是undefined 或路径绝对 URL。

为了在给定 method 和 URL 的情况下匹配请求，必须采取以下步骤：

令 endpoints 为一个列表，包含端点表中的每一行。
从 endpoints 中移除每个条目，如果 URL 前缀与该条目的URI 模板的串联没有一个有效展开等于 URL 的路径。
如果 endpoints 中没有条目，则返回错误，其错误码为 unknown command。
移除 endpoints 中 method 列不等于 method 的每个条目。
如果 endpoints 中没有条目，则返回错误，其错误码为 unknown method。
现在 endpoints 中恰好有一个条目；令 entry 为该条目。
令 URI template 为 URL 前缀与 entry 的 URI template 的串联。
令 command 为 entry 的命令。
令 URL variables 为一个map，对于 URI template 中定义的每个变量都有一个 entry，其条目名称等于模板变量名称，条目值为将 URI template 展开以匹配 URL 的路径所需的变量值。
返回成功，其数据为 command 和 URL variables。

以下端点表列出了每个端点节点命令的 method 和 URI 模板。扩展命令会隐式附加到该表。

方法	URI 模板	命令
POST	/session	新建会话
DELETE	/session/{`session id`}	删除会话
GET	/status	状态
GET	/session/{`session id`}/timeouts	获取超时
POST	/session/{`session id`}/timeouts	设置超时
POST	/session/{`session id`}/url	导航到
GET	/session/{`session id`}/url	获取当前 URL
POST	/session/{`session id`}/back	后退
POST	/session/{`session id`}/forward	前进
POST	/session/{`session id`}/refresh	刷新
GET	/session/{`session id`}/title	获取标题
GET	/session/{`session id`}/window	获取窗口句柄
DELETE	/session/{`session id`}/window	关闭窗口
POST	/session/{`session id`}/window	切换到窗口
GET	/session/{`session id`}/window/handles	获取窗口句柄列表
POST	/session/{`session id`}/window/new	新建窗口
POST	/session/{`session id`}/frame	切换到框架
POST	/session/{`session id`}/frame/parent	切换到父框架
GET	/session/{`session id`}/window/rect	获取窗口矩形
POST	/session/{`session id`}/window/rect	设置窗口矩形
POST	/session/{`session id`}/window/maximize	最大化窗口
POST	/session/{`session id`}/window/minimize	最小化窗口
POST	/session/{`session id`}/window/fullscreen	全屏窗口
GET	/session/{`session id`}/element/active	获取活动元素
GET	/session/{`session id`}/element/{`element id`}/shadow	获取元素的 Shadow Root
POST	/session/{`session id`}/element	查找元素
POST	/session/{`session id`}/elements	查找元素列表
POST	/session/{`session id`}/element/{element id}/element	从元素查找元素
POST	/session/{`session id`}/element/{element id}/elements	从元素查找元素列表
POST	/session/{`session id`}/shadow/`{shadow id}`/element	从 Shadow Root 查找元素
POST	/session/{`session id`}/shadow/`{shadow id}`/elements	从 Shadow Root 查找元素列表
GET	/session/{`session id`}/element/{`element id`}/selected	元素是否被选中
GET	/session/{`session id`}/element/{`element id`}/attribute/{`name`}	获取元素属性
GET	/session/{`session id`}/element/{`element id`}/property/{`name`}	获取元素属性值
GET	/session/{`session id`}/element/{`element id`}/css/{`property name`}	获取元素 CSS 值
GET	/session/{`session id`}/element/{`element id`}/text	获取元素文本
GET	/session/{`session id`}/element/{`element id`}/name	获取元素标签名称
GET	/session/{`session id`}/element/{`element id`}/rect	获取元素矩形
GET	/session/{`session id`}/element/{`element id`}/enabled	元素是否启用
GET	/session/{`session id`}/element/{`element id`}/computedrole	获取计算角色
GET	/session/{`session id`}/element/{`element id`}/computedlabel	获取计算标签
POST	/session/{`session id`}/element/{`element id`}/click	元素点击
POST	/session/{`session id`}/element/{`element id`}/clear	元素清除
POST	/session/{`session id`}/element/{`element id`}/value	元素发送按键
GET	/session/{`session id`}/source	获取页面源码
POST	/session/{`session id`}/execute/sync	执行脚本
POST	/session/{`session id`}/execute/async	执行异步脚本
GET	/session/{`session id`}/cookie	获取所有 Cookie
GET	/session/{`session id`}/cookie/{`name`}	获取具名 Cookie
POST	/session/{`session id`}/cookie	添加 Cookie
DELETE	/session/{`session id`}/cookie/{`name`}	删除 Cookie
DELETE	/session/{`session id`}/cookie	删除所有 Cookie
POST	/session/{`session id`}/actions	执行操作
DELETE	/session/{`session id`}/actions	释放操作
POST	/session/{`session id`}/alert/dismiss	取消警告框
POST	/session/{`session id`}/alert/accept	接受警告框
GET	/session/{`session id`}/alert/text	获取警告框文本
POST	/session/{`session id`}/alert/text	发送警告框文本
GET	/session/{`session id`}/screenshot	截取屏幕截图
GET	/session/{`session id`}/element/{`element id`}/screenshot	截取元素屏幕截图
POST	/session/{`session id`}/print	打印页面

错误在 WebDriver 协议中表示为一个HTTP 响应，其HTTP 状态在 4xx 或 5xx 范围内，并且 JSON 主体包含该错误的详细信息。该主体是一个 JSON Object，并且有一个名为 "value" 的字段，其值是一个带有三个字段、有时带有四个字段的对象：

"error"，包含一个指示错误码的字符串。
"message"，包含一个实现定义的字符串，对所发生错误的种类作出人类可读描述。
"stacktrace"，包含一个实现定义的字符串，其中包含错误发生时活动栈帧的栈跟踪报告。
可选的 "data"，它是一个 JSON Object，带有有助于诊断错误的额外错误数据。

示例 3

对 /session/1234/url 发出的 GET 请求，其中 1234 不是某个会话的会话 ID，将返回一个状态为 404 且正文形式如下的HTTP 响应：

{
	"value": {
		"error": "invalid session id",
		"message": "No active session with ID 1234",
		"stacktrace": ""
	}
}

某些命令还可以使用额外的错误数据来注释错误。值得注意的是，对于调用用户提示处理器的命令就是这种情况，其中用户提示消息可以包含在 "text" 字段中：

{
	"value": {
		"error": "unexpected alert open",
		"message": "",
		"stacktrace": "",
		"data": {
			"text": "Message from window.alert"
		}
	}
}

下表列出了每个错误码、其关联的HTTP 状态、 JSON error 代码，以及错误的非规范性描述。特定错误码的错误响应数据是与该错误码对应行中的 HTTP Status 和 JSON Error Code 列的值。

错误码	HTTP 状态	JSON 错误码	描述
element click intercepted	400	`element click intercepted`	Element Click 命令无法完成，因为接收事件的元素正在遮挡被请求点击的元素。
element not interactable	400	`element not interactable`	命令无法完成，因为该元素不是指针或键盘可交互的。
insecure certificate	400	`insecure certificate`	导航导致用户代理遇到证书警告，这通常是过期或无效 TLS 证书的结果。
invalid argument	400	`invalid argument`	传递给命令的参数无效或格式错误。
invalid cookie domain	400	`invalid cookie domain`	尝试在与当前页面不同的域下设置 cookie，这是非法操作。
invalid element state	400	`invalid element state`	命令无法完成，因为元素处于无效状态，例如尝试清除一个既不是可编辑也不是可重置的元素。
invalid selector	400	`invalid selector`	参数是无效选择器。
invalid session id	404	`invalid session id`	在给定的会话 ID不在活动会话列表中时发生，这意味着该会话要么不存在，要么不是活动的。
javascript error	500	`javascript error`	执行用户提供的 JavaScript 时发生错误。
move target out of bounds	500	`move target out of bounds`	鼠标交互的目标不在浏览器视口中，且无法被带入该视口。
no such alert	404	`no such alert`	在没有打开模态对话框时，尝试对其进行操作。
no such cookie	404	`no such cookie`	在 `session` 的当前浏览上下文的活动文档的关联 cookie 中未找到与给定路径名称匹配的 cookie。
no such element	404	`no such element`	无法使用给定的搜索参数在页面上定位元素。
no such frame	404	`no such frame`	切换到框架的命令无法满足，因为无法找到该框架。
no such window	404	`no such window`	切换到窗口的命令无法满足，因为无法找到该窗口。
no such shadow root	404	`no such shadow root`	该元素没有 shadow root。
script timeout error	500	`script timeout`	脚本未在其超时到期前完成。
session not created	500	`session not created`	无法创建新的会话。
stale element reference	404	`stale element reference`	命令失败，因为被引用的元素已不再附加到 DOM。
detached shadow root	404	`detached shadow root`	命令失败，因为被引用的shadow root已不再附加到 DOM。
timeout	500	`timeout`	操作未在其超时到期前完成。
unable to set cookie	500	`unable to set cookie`	设置 cookie 值的命令无法满足。
unable to capture screen	500	`unable to capture screen`	无法进行屏幕捕获。
unexpected alert open	500	`unexpected alert open`	模态对话框处于打开状态，阻止了此操作。
unknown command	404	`unknown command`	命令无法执行，因为远程端不知道该命令。
unknown error	500	`unknown error`	在处理命令时，远程端中发生未知错误。
unknown method	405	`unknown method`	请求的命令匹配了已知 URL，但没有匹配该 URL 的任何方法。
unsupported operation	500	`unsupported operation`	表示一个本应正确执行的命令由于某种原因无法被支持。

错误数据字典是字符串键到 JSON 可序列化值的映射，可以可选地包含在错误对象中。

使用本节中定义的术语，其他人可以定义额外的命令，以无缝集成到标准协议中。这允许供应商公开其用户代理特有的功能，也允许其他 Web 标准定义用于自动化新平台特性的命令。

以这种方式定义的命令称为扩展命令，且其行为与其他命令没有任何不同；每个命令都有专用的 HTTP 端点和一组远程端步骤。

每个扩展命令具有关联的扩展命令 URI 模板，它是一个URI 模板字符串，并且应当与该命令所执行的操作有一定相似性。该值连同 HTTP 方法和扩展命令一起被添加到端点表，因而遵循与其他内建命令相同的请求路由规则。

为了避免与其他实现发生潜在的资源冲突，供应商特定的扩展命令 URI 模板必须以一个或多个能唯一标识供应商和 UA 的路径片段开始。建议供应商使用其供应商前缀，不添加额外字符，如 [CSS21] 中所概述的那样，尤其是关于 供应商关键字的第 4.1.2.2 节，将其作为该路径元素的名称，并包含供应商选择的 UA 标识符。

注

其他规范可以定义额外的 WebDriver 能力。每个定义的能力都必须有一个能力名称，它是不包含 ":"（冒号）字符的字符串；以及一个额外能力反序列化算法，它是一组步骤，接受一个具有 JSON 类型的参数 value，并返回封装反序列化能力值的成功，或错误。

额外的 WebDriver 能力也可以定义匹配能力序列化算法，它是一组步骤，用于确定某个能力是否由当前实现匹配，并提供要返回给用户的任何计算值。这组步骤接受一个参数 value，该参数是对应额外能力反序列化算法的输出，并返回null 以表示该能力未匹配，或者在该能力匹配时返回一个非 null 的 JSON 可序列化值。

其他规范也可以定义WebDriver 新会话算法，这些算法在创建新会话之后、向远程端发送新会话响应之前被调用。这些算法使用表示将要建立的 WebDriver 会话的 session，以及将返回给远程端的能力对象 capabilities 进行调用。允许此类算法修改能力对象中名称为同一规范定义的额外 WebDriver 能力的任何条目。

远程端还可以引入扩展能力，它们是额外的能力，用于提供配置或满足其他供应商特定需求。扩展能力的键必须包含 ":"（冒号）字符，表示实现特定的命名空间。该值可以是任意 JSON 类型。

与扩展命令一样，建议用于表示扩展能力命名空间的键基于 [CSS21] 中列出的供应商关键字，并且位于字符串中第一个 ":" 字符之前。

示例 5

扩展能力通常用于提供 UA 或中介节点特定的配置，而这些配置不由标准能力表处理。

新会话请求主体的示例可能如下所示：

{
  "capabilities": {
    "alwaysMatch": {
      // browser specific configuration
      "<prefix>:browserOptions": {
        "binary": "/usr/bin/browser-binary",
        "args": ["--start-page=https://example.com"],
      }
    }
  }
}

WebDriver 能力用于传达给定实现所支持的特性。本地端可以使用能力来定义其在创建新会话时要求远程端满足哪些特性。同样，远程端使用能力来描述一个会话的完整特性集。

以下标准能力表枚举了每个实现必须支持的能力。实现可以定义额外的扩展能力。

示例 6

例如，Mozilla 可以选择将新特性隐藏在带有 "moz:" 前缀的能力之后：

{
	"browserName": "firefox",
	"browserVersion": "1234",
	"moz:experimental-webdriver": true
}

能力	键	值类型	描述
浏览器名称	"`browserName`"	string	标识用户代理。
浏览器版本	"`browserVersion`"	string	标识用户代理的版本。
平台名称	"`platformName`"	string	标识端点节点的操作系统。
接受不安全的 TLS 证书	"`acceptInsecureCerts`"	boolean	指示在导航时，在会话持续期间，是否隐式信任不受信任的和自签名的 TLS 证书。
页面加载策略	"`pageLoadStrategy`"	string	定义会话的页面加载策略。
代理配置	"`proxy`"	JSON 对象	定义会话的代理配置。
窗口尺寸调整/定位	"`setWindowRect`"	boolean	指示远程端是否支持所有调整窗口大小和重新定位命令。
会话超时	"`timeouts`"	JSON 对象	描述对某些会话操作施加的超时。
严格文件可交互性	"`strictFileInteractability`"	boolean	定义会话的严格文件可交互性。
未处理提示行为	"`unhandledPromptBehavior`"	string	描述会话的用户提示处理器。默认为 "`dismiss and notify`"。
User Agent	"`userAgent`"	string	标识端点节点的默认 User-Agent 值。

代理配置能力是嵌套在主要能力中的 JSON Object。实现可以定义额外的代理配置选项，但不得改变下列选项的语义。

键	值类型	描述	有效值
`proxyType`	string	指示代理配置的类型。	"`pac`", "`direct`", "`autodetect`", "`system`", 或 "`manual`"。
`proxyAutoconfigUrl`	string	如果 `proxyType` 等于 "`pac`"，则定义代理自动配置文件的 URL。	任意URL。
`httpProxy`	string	当 `proxyType` 为 "`manual`" 时，定义 HTTP 流量的代理主机。	scheme 为 "`http`" 的主机和可选端口。
`noProxy`	array	列出当 `proxyType` 为 "`manual`" 时应绕过代理的地址。	包含任意数量 String 的List。
`sslProxy`	string	当 `proxyType` 为 "`manual`" 时，定义加密 TLS 流量的代理主机。	scheme 为 "`https`" 的主机和可选端口。
`socksProxy`	string	当 `proxyType` 为 "`manual`" 时，定义 SOCKS 代理的代理主机。	scheme 为undefined 的主机和可选端口。
`socksVersion`	number	当 `proxyType` 为 "`manual`" 时，定义 SOCKS 代理版本。	0 到 255（含）之间的任意整数。

用于 scheme 的主机和可选端口定义为有效的主机，可选地后跟一个冒号和有效的端口。该主机可以包含凭据。如果省略端口且 scheme 具有默认端口，则该端口为隐含端口。否则，端口保持未定义。

proxyType 为 "direct" 表示浏览器完全不应使用代理。

proxyType 为 "system" 表示浏览器应使用底层操作系统配置的各种代理。

proxyType 为 "autodetect" 表示应以实现特定的方式检测要使用的代理。

远程端将参数 parameter 反序列化为代理的步骤为：

如果 parameter 不是 JSON Object，则返回一个错误，其错误码为 invalid argument。
令 proxy 为一个新的空代理配置对象。
对于 parameter 中的每个可枚举自身属性，运行以下子步骤：
1. 令 key 为属性的名称。
2. 令 value 为从 parameter 获取名为 name 的属性的结果。
3. 如果代理配置表中没有与 key 匹配的 key，则返回一个错误，其错误码为 invalid argument。
4. 如果 value 不是该 key 的有效值之一，则返回一个错误，其错误码为 invalid argument。
5. 在 proxy 上将属性 key 设置为 value。
如果 proxy 没有 "proxyType" 的自身属性，则返回一个错误，其错误码为 invalid argument。
如果从 proxy 获取名为 "proxyType" 的属性的结果等于 "pac"，且 proxy 没有 "proxyAutoconfigUrl" 的自身属性，则返回一个错误，其错误码为 invalid argument。
如果 proxy 具有 "socksProxy" 的自身属性，但没有 "socksVersion" 的自身属性，则返回一个错误，其错误码为 invalid argument。
返回成功，其数据为 proxy。

代理配置对象是一个 JSON Object，其中每个匹配代理配置中键的自身属性都满足该键的有效性标准。

给定 parameters 和会话配置标志 flags，为了处理能力，端点节点必须采取以下步骤：

令 capabilities request 为从 parameters 获取属性 "capabilities" 的结果。
1. 如果 capabilities request 不是 JSON Object，则返回错误，其错误码为 invalid argument。
令 required capabilities 为从 capabilities request 获取属性 "alwaysMatch" 的结果。
1. 如果 required capabilities 为undefined，则将该值设为一个空 JSON Object。
2. 令 required capabilities 为使用 required capabilities 和 flag 作为参数， trying 去验证能力的结果。
令 all first match capabilities 为从 capabilities request 获取属性 "firstMatch" 的结果。
1. 如果 all first match capabilities 为undefined，则将该值设为一个List，其中单个条目为空 JSON Object。
2. 如果 all first match capabilities 不是一个包含一个或多个条目的List，则返回错误，其错误码为 invalid argument。
令 validated first match capabilities 为空 List。
对于 all first match capabilities 中与索引属性对应的每个 first match capabilities：
1. 令 validated capabilities 为使用 first match capabilities 和 flags 作为参数， trying 去验证能力的结果。
2. 将 validated capabilities 追加到 validated first match capabilities。
令 merged capabilities 为空 List。
对于 validated first match capabilities 中与索引属性对应的每个 first match capabilities：
1. 令 merged 为以 required capabilities 和 first match capabilities 作为参数， trying 去合并能力的结果。
2. 将 merged 追加到 merged capabilities。
对于 merged capabilities 中与索引属性对应的每个 capabilities：
1. 令 matched capabilities 为以 capabilities 作为参数， trying 去匹配能力的结果。
2. 如果 matched capabilities 不是null，则返回成功，其数据为 matched capabilities。
返回成功，其数据为null。

当被要求使用参数 capabilities 验证能力时：

如果 capabilities 不是 JSON Object，则返回一个错误，其错误码为 invalid argument。
令 result 为空 JSON Object。
对于 capabilities 中的每个可枚举自身属性，运行以下子步骤：
1. 令 name 为属性的名称。
2. 令 value 为从 capabilities 获取名为 name 的属性的结果。
3. 运行第一个匹配条件的子步骤：
  
  value 为null
  
  令 deserialized 被设置为null。
  
  name 等于 "acceptInsecureCerts"
  
  如果 value 不是boolean，则返回一个错误，其错误码为 invalid argument。否则，令 deserialized 被设置为 value。
  
  name 等于 "browserName"
  
  name 等于 "browserVersion"
  
  name 等于 "platformName"
  
  如果 value 不是string，则返回一个错误，其错误码为 invalid argument。否则，令 deserialized 被设置为 value。
  
  name 等于 "pageLoadStrategy"
  
  令 deserialized 为以 value 作为参数， trying 去反序列化为页面加载策略的结果。
  
  name 等于 "proxy"
  
  令 deserialized 为以 value 作为参数， trying 去反序列化为代理的结果。
  
  name 等于 "strictFileInteractability"
  
  如果 value 不是boolean，则返回一个错误，其错误码为 invalid argument。否则，令 deserialized 被设置为 value
  
  name 等于 "timeouts"
  
  令 deserialized 为使用 value， trying 去反序列化为超时配置的结果。
  
  name 等于 "unhandledPromptBehavior"
  
  令 deserialized 为以 value 作为参数， trying 去反序列化为未处理提示行为的结果。
  
  name 是某个额外 WebDriver 能力的名称
  
  令 deserialized 为以 value 作为参数， trying 去运行与 name 对应的扩展能力的额外能力反序列化算法的结果。
  
  name 是某个扩展能力的键
  
  如果实现已知 name，则令 deserialized 为以实现特定方式 trying 去反序列化 value 的结果。否则，令 deserialized 被设置为 value。
  
  远程端是端点节点
  
  返回一个错误，其错误码为 invalid argument。
4. 如果 deserialized 不是null，则在 result 上以名称 name 和值 deserialized 设置属性。
返回成功，其数据为 result。

当使用 JSON Object 参数 primary 和 secondary 合并能力时，端点节点必须采取以下步骤：

令 result 为一个新的 JSON Object。
对于 primary 中的每个可枚举自身属性，运行以下子步骤：
1. 令 name 为属性的名称。
2. 令 value 为从 primary 获取名为 name 的属性的结果。
3. 在 result 上以名称 name 和值 value 设置属性。
如果 secondary 为undefined，则返回 result。
对于 secondary 中的每个可枚举自身属性，运行以下子步骤：
1. 令 name 为属性的名称。
2. 令 value 为从 secondary 获取名为 name 的属性的结果。
3. 令 primary value 为从 primary 获取属性 name 的结果。
4. 如果 primary value 不是undefined，则返回一个错误，其错误码为 invalid argument。
5. 在 result 上以名称 name 和值 value 设置属性。
返回 result。

注

给定 JSON Object capabilities 和会话配置标志 flags，当匹配能力时，端点节点必须采取以下步骤：

令 matched capabilities 为一个 JSON Object，具有以下条目：

"browserName"

用户代理名称的 ASCII 小写形式，作为 string。

"browserVersion"

用户代理版本，作为string。

"platformName"

当前平台名称的 ASCII 小写形式，作为 string。

"acceptInsecureCerts"

Boolean，初始设置为 false，表示会话不会在导航时隐式信任不受信任的或自签名的 TLS 证书。

"strictFileInteractability"

Boolean，初始设置为 false，表示会对 <input type=file> 应用可交互性检查。

"setWindowRect"

Boolean，指示远程端是否支持所有调整大小和定位命令。

"userAgent"

包含默认 User-Agent 值的 String。
如果 flags 包含 "http"，则将以下条目添加到 matched capabilities：

"strictFileInteractability"

Boolean，初始设置为 false，表示会对 <input type=file> 应用可交互性检查。
可选地将扩展能力作为条目添加到 matched capabilities。这些值可以被省略，并且不要求添加所有扩展能力。

注

这允许远程端添加可能对本地端有用的信息，而不会用（例如）整个浏览器配置文件不必要地膨胀返回给用户的响应。

例如，实现可以选择通过将能力 se:screenshot-on-error 设置为 true，来表示返回错误时会截取屏幕截图。

对于与 capabilities 的自身属性对应的每个 name 和 value：

令 match value 等于 value。

运行第一个匹配 name 的子步骤：

"browserName"

如果 value 不是等于 matched capabilities 中 "browserName" 条目的 string，则返回成功，其数据为null。

注

有可能远程端需要启动浏览器进程以正确确定 browserName。在执行此操作之前，首选轻量级检查。

"browserVersion"

使用实现定义的比较算法，将 value 与 matched capabilities 中的 "browserVersion" 条目进行比较。该比较应接受使用 "<"、"<="、">" 和 ">=" 运算符对版本施加约束的 value。

如果两个值不匹配，则返回成功，其数据为null。

注

版本比较作为实现细节保留，因为每个用户代理可能都有冲突的方法来编码用户代理版本，而标准化这些方案超出了本标准的范围。

注

有可能远程端需要启动浏览器进程以正确确定 browserVersion。在执行此操作之前，首选轻量级检查。

"platformName"

如果 value 不是等于 matched capabilities 中 "platformName" 条目的 string，则返回成功，其数据为null。

注

以下平台名称在通常使用中具有明确理解的语义，并且在为平台名称匹配能力时，将它们作为知名操作系统的有效同义词予以认可，可以实现最大的互操作性：

键	系统
"`linux`"	任何基于 Linux 内核的服务器或桌面系统。
"`mac`"	Apple 的 macOS 的任何版本。
"`windows`"	Microsoft Windows 的任何版本，包括桌面版和移动版。

此列表并不详尽。

从New Session返回能力时，返回更具体的 platformName 是有效的，以允许用户正确识别 WebDriver 实现正在运行的操作系统。

"acceptInsecureCerts"

如果accept insecure TLS 标志已设置且不等于 value，则返回成功，其数据为null。

注

如果端点节点不支持不安全的 TLS 证书，并且这是最终无法匹配的原因，则向本地端提供此信息是有用的。

"proxy"

如果has proxy configuration 标志已设置，或者 value 中定义的代理配置未通过端点节点的实现特定有效性检查，则返回成功，其数据为null。

注

本地端只有在期望该能力被认可并使用已配置代理时，才会发送此能力。其意图是，如果无法做到这一点，则不会建立新会话。

"unhandledPromptBehavior"

如果使用 value 调用 check user prompt handler matches 为 false，则返回成功，其数据为null。

否则

如果 name 是定义了匹配能力序列化算法的某个额外 WebDriver 能力的名称，则令 match value 为使用 value 和 flags 作为参数，为能力 name 运行匹配能力序列化算法的结果。
否则，如果 name 是某个扩展能力的键，则令 match value 为使用 value， trying 实现特定步骤来匹配 name 的结果。如果匹配未成功，则返回成功，其数据为null。

如果 match value 不是 null，则在 matched capabilities 上以名称 name 和值 match value 设置属性。

返回成功，其数据为 matched capabilities。

WebDriver 会话表示本地端与一个特定远程端之间的逻辑连接。会话对象保存特定于该连接的状态。

中介节点将为每个活动会话维护一个关联会话。这是中介节点执行新建会话命令时，在上游邻居上创建的会话。关闭中介节点上的一个会话，也会关闭关联会话的会话。

会话有一个会话 ID，它是用于唯一标识该会话的UUID的字符串表示。这是在创建会话时设置的。

会话有一个布尔值HTTP 标志，它在会话创建时设置。设置了此标志的会话是一个HTTP 会话。

远程端有关联的活动会话列表，这是当前已启动的所有会话的列表。

远程端有关联的活动 HTTP 会话列表，这是当前已启动的所有HTTP 会话的列表。

注

对端点节点而言仅限单个 HTTP 会话，这意味着活动 HTTP 会话列表中的第一个条目将是唯一的条目。

HTTP 会话有关联的当前浏览上下文，它是命令将针对其运行的浏览上下文，有关联的当前父浏览上下文，它在更改浏览上下文时被设置为当前浏览上下文的父级，以及关联的当前顶级浏览上下文，它在更改浏览上下文时被设置为当前浏览上下文的顶级浏览上下文祖先。

HTTP 会话有关联的会话超时，它是一个超时配置。它初始设置为一个新的超时配置。

HTTP 会话有关联的页面加载策略，它是页面加载策略表中的关键字之一。它初始设置为normal。

HTTP 会话有关联的严格文件可交互性状态，它是一个布尔值。它初始设置为 false。

会话有关联的浏览上下文输入状态映射，它是一个以顶级浏览上下文为键、以输入状态对象为值的弱映射。它初始设置为空映射。

HTTP 会话有关联的请求队列，它是由当前等待处理的请求组成的队列。

创建会话时，会提供一集合会话配置标志，用于定义会话的特性。此规范始终创建在会话配置标志中带有 "http" 的会话，这对应于HTTP 标志。外部规范可以定义额外的标志，或创建不带HTTP 标志的会话。

除了每会话状态之外，作为端点节点的远程端还具有跨所有会话全局的附加状态。

端点节点有关联的接受不安全 TLS标志，该标志指示是否将不受信任或自签名的 TLS 证书视为受信任。如果端点不支持接受不安全的 TLS 连接，则该标志的默认值为 false；否则为未设置。

端点节点有关联的已有代理配置标志，该标志指示代理是否已经配置。如果端点不支持代理配置，则该标志的默认值为 true；否则为 false。

要在给定 JSON Object capabilites 和会话配置标志 flags 时创建会话：

令 session id 为生成 UUID的结果。
令 session 为一个新的会话，其会话 ID为 session id，且HTTP 标志为 flags 包含 "http"。
令 proxy 为从 capabilities 获取属性 "proxy" 的结果，并运行第一个匹配语句的子步骤：

proxy 是一个代理配置对象

执行实现定义的步骤，使用提取的 proxy 配置设置用户代理代理。如果定义的代理无法配置，则返回错误，其错误代码为session not created。否则将已有代理配置标志设置为 true。

否则

设置 capabilities 的一个属性，其名称为 "proxy"，值为一个新的 JSON Object。
如果 capabilites 有一个名为 "acceptInsecureCerts" 的属性，则将端点节点的接受不安全 TLS标志设置为从 capabilities 获取名为 "acceptInsecureCerts" 的属性的结果。
令 user prompt handler capability 为从 capabilities 获取属性 "unhandledPromptBehavior" 的结果。
如果 user prompt handler capability 不是 undefined，则使用 user prompt handler capability 更新用户提示处理器。
令 serialized user prompt handler 为序列化用户提示处理器的结果。
在 capabilities 上设置一个属性，其名称为 "unhandledPromptBehavior"，值为 serialized user prompt handler。
如果 flags contains "http"：
1. 令 strategy 为从 capabilities 获取属性 "pageLoadStrategy" 的结果。
  
  如果 strategy 是 string，则将会话的页面加载策略设置为 strategy。否则，将页面加载策略设置为 normal，并设置 capabilities 的一个属性，其名称为 "pageLoadStrategy"，值为 "normal"。
2. 令 strictFileInteractability 为从 capabilities 获取属性 "strictFileInteractability" 的结果。如果 strictFileInteractability 是 boolean，则将会话的严格文件可交互性设置为 strictFileInteractability。
3. 令 timeouts 为从 capabilities 获取属性 "timeouts" 的结果。如果 timeouts 不是 undefined，则将 session 的会话超时设置为 timeouts。
4. 在 capabilities 上设置一个属性，其名称为 "timeouts"，值为使用 session 的会话超时序列化超时配置的结果。
以实现定义的方式处理 capabilities 中的任何扩展能力。
使用参数 session、 capabilities 和 flags，运行外部规范中定义的任何WebDriver 新建会话算法。
将 session 追加到活动会话。
如果 flags 包含 "http"，则将 session 追加到活动 HTTP 会话。
将webdriver-active 标志设置为 true。

要在给定 session 时关闭会话，远程端必须执行以下步骤：

如果设置了 session 的HTTP 标志，则从活动 HTTP 会话中移除 session。
从活动会话中移除 session。
根据远程端的类型执行以下子步骤：
远程端是一个端点节点
1. 如果活动会话列表为空：
  1. 将webdriver-active 标志设置为 false
  2. 将用户提示处理器设置为 null。
  3. 取消设置接受不安全 TLS标志。
  4. 将已有代理配置标志重置为其默认值。
  5. 可选地，关闭所有顶级浏览上下文，且不提示卸载。
远程端是一个中介节点
1. 关闭关联会话。如果这导致错误发生，则先完成此算法的其余部分，然后返回该错误。
执行任何实现特定的清理步骤。
如果上述任何步骤中发生了错误，则返回该错误，否则返回成功，其数据为null。

关闭会话可能导致关联的浏览器进程被终止。假设任何实现特定的清理步骤都在响应已发回客户端之后执行，这样连接就不会过早关闭。

HTTP 方法	URI 模板
POST	/session

新建会话命令会使用端点节点创建一个新的 WebDriver 会话。如果创建失败，则返回session not created 错误。

如果远程端是中介节点，它可以使用能力处理算法的结果，将新会话请求路由到适当的端点节点。中介节点可以自由定义扩展能力来协助此过程；但是，这些特定能力不得转发给端点节点。

如果中介节点需要与用户代理特性无关的额外信息，建议将此信息作为顶层参数传递，而不是作为请求的能力的一部分传递。中介节点必须将自定义的顶层参数（即非能力）转发给后续远程端节点。

示例 7

中介节点可能要求在创建新会话时进行认证。该认证是 New Session 命令本身的参数，而不是用户代理的能力。因此，认证应作为顶层参数传递，而不是嵌入在 capabilities 中：

{
	"user": "alice",
	"password": "hunter2",
	"capabilities": {…}
}

但是，由于中介节点不能将特定于该实现的扩展能力转发给端点节点，因此本规范也允许如下形式：

{
    "capabilities": {
        "alwaysMatch": {
            "cloud:user": "alice",
            "cloud:password": "hunter2",
            "platformName": "linux"
        },
        "firstMatch": [
            {"browserName": "chrome"},
            {"browserName": "edge"}
        ]
    }
}

一旦此示例中的所有能力被合并，端点节点将收到与以下内容相同的 New Session 能力：

[
    {"browserName": "chrome", "platformName": "linux"},
    {"browserName": "edge", "platformName": "linux"}
]

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果实现是端点节点，且活动 HTTP 会话列表非空，或者在其他情况下实现无法启动额外会话，则返回错误，其错误码为 session not created。
如果远程端是一个中介节点，则执行实现定义的步骤，其结果要么是返回一个错误，其错误代码为session not created，要么是返回一个成功，其数据同构于远程端根据本算法其余部分返回的数据。如果未返回错误，则该中介节点必须保留对在上游节点上创建的会话的引用，将其作为关联会话，以便在后续命令中可以将命令转发给此关联会话。

注

如何完成这一点完全取决于实现，但通常需要跟踪 sessionId，以及上游远程端的 URL 和 URL 前缀。
令 flags 为包含 "http" 的 set。
令 capabilities 为以 parameters 和 flags trying 去处理能力的结果。
如果 capabilities 是null，则返回错误，其错误码为 session not created。
令 session 为使用 capabilities 和 flags 创建会话的结果。
令 body 为用以下内容初始化的 JSON Object：

"sessionId"

session 的会话 ID。

"capabilities"

capabilities
将 session 的当前顶级浏览上下文设置为端点节点的顶级浏览上下文之一，优先选择具有系统焦点的顶级浏览上下文，或者否则优先选择任何其可见性状态为visible的顶级浏览上下文。

注

WebDriver 实现通常会启动一个全新的浏览器实例，但本规范中没有要求必须这样做（也没有要求 WebDriver 只能用于自动化 Web 浏览器）。实现可以选择使用已有的浏览器实例，例如通过选择当前具有焦点的窗口。
将请求队列设置为新的queue。
返回成功，其数据为 body。

HTTP 方法	URI 模板
DELETE	/session/{`session id`}

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 是活动 HTTP 会话，则try 使用 session 关闭会话。
返回成功，其数据为null。

HTTP 方法	URI 模板
GET	/status

注

实现可以可选地将额外元信息作为主体的一部分包含进来，但顶层属性 ready 和 message 是保留的，不得被覆盖。

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 body 为一个新的 JSON Object，具有以下属性：

"ready"

远程端的就绪状态。

"message"

一个实现定义的字符串，解释远程端的就绪状态。
返回成功，其数据为 body。

计时器是一个 struct。它有一个超时触发标志，它是一个 boolean，初始为 false。

给定 timer 和 timeout，为了启动计时器

断言：timeout 不为 null。
并行运行以下步骤：
1. 等待至少 timeout 毫秒经过。
2. 将 timer 的超时触发标志设置为 true。

超时配置是一个 struct，表示脚本求值、导航和元素检索的超时。它有一个脚本超时项，它是整数或 null，且初始设置为 30,000；一个页面加载超时项，它是整数或 null，且初始设置为 300,000；以及一个隐式等待超时项，它是整数或 null，且初始设置为 0。给定 timeouts，为了反序列化为超时配置：

将 timeouts 设置为使用 timeouts 将 JSON 派生的 JavaScript 值转换为 Infra 值的结果。
令 configuration 为一个新的超时配置。
对于 timeouts 中的每个 key → value：
1. 如果 «"script", "pageLoad", "implicit"» 不包含 key，则继续。
2. 如果 value 既不是 null，也不是大于或等于 0 且小于或等于最大安全整数的 number，则返回错误，其错误码为 invalid argument。
3. 运行与 key 匹配的子步骤：
  
  "script"
  
  将 configuration 的脚本超时设置为 value。
  
  "pageLoad"
  
  将 configuration 的页面加载超时设置为 value。
  
  "implicit"
  
  将 configuration 的隐式等待超时设置为 value。
返回成功，其数据为 configuration。

给定 timeouts，为了序列化超时配置：

令 serialized 为空map。
将 serialized["script"] 设置为 timeouts 的脚本超时。
将 serialized["pageLoad"] 设置为 timeouts 的页面加载超时。
将 serialized["implicit"] 设置为 timeouts 的隐式等待超时。
返回使用 serialized 将 Infra 值转换为 JSON 兼容的 JavaScript 值的结果。

MDN

Commands/GetTimeouts

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
GET	/session/{`session id`}/timeouts

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 timeouts 为使用会话的超时配置序列化超时配置的结果
返回数据为 timeouts 的成功。

MDN

Commands/SetTimeouts

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
POST	/session/{`session id`}/timeouts

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 timeouts 为使用 parameters trying 去反序列化为超时配置的结果。
将 session 的超时配置设置为 timeouts。
返回成功，其数据为null。

关键字	页面加载策略状态	文档就绪状态
"`none`"	none
"`eager`"	eager	"`interactive`"
"`normal`"	normal	"`complete`"

HTTP 方法	URI 模板
POST	/session/{`session id`}/url

HTTP 方法	URI 模板
GET	/session/{`session id`}/url

HTTP 方法	URI 模板
POST	/session/{`session id`}/back

HTTP 方法	URI 模板
POST	/session/{`session id`}/forward

HTTP 方法	URI 模板
POST	/session/{`session id`}/refresh

HTTP 方法	URI 模板
GET	/session/{`session id`}/title

许多 WebDriver 命令发生在 session 的当前浏览上下文或当前顶级浏览上下文的上下文中。 session 的当前顶级浏览上下文在协议中由其关联的窗口句柄表示。当使用切换到窗口命令选择一个顶级浏览上下文时，可以使用切换到框架命令选择特定的浏览上下文。

注

使用术语“window”来指代顶级浏览上下文是历史遗留用法，既不对应操作系统中“窗口”的概念，也不对应 DOM Window 对象。

如果一个浏览上下文的 navigable 已被销毁，则称该浏览上下文不再打开。

每个浏览上下文都有一个关联的窗口句柄，它唯一标识该浏览上下文。这必须是一个 String，并且不得是 "current"。

web 框架是一种抽象，用于在通过协议、在远程端与本地端之间传输时，标识 frame 或 iframe。

web frame 标识符是字符串常量 "frame-075b-4da1-b6ba-e579c2d3230a"。

如果 ECMAScript Object 具有一个web frame 标识符自身属性，则该对象表示 web 框架。

web 窗口是一种抽象，用于在通过协议、在远程端与本地端之间传输时，标识窗口。

web window 标识符是字符串常量 "window-fcc6-11e5-b4f8-330a88ab9d7f"。

如果 ECMAScript Object 具有一个web window 标识符自身属性，则该对象表示 web 窗口。

带有 WindowProxy 对象 window 的 WindowProxy 引用对象由以下方式给出：

如果 window 的关联浏览上下文是顶级浏览上下文，则令 identifier 为web window 标识符。

否则令其为web frame 标识符。
返回一个使用以下属性初始化的 JSON Object：

identifier

window 的浏览上下文的关联窗口句柄。

为了通过一个 JSON Object object 来反序列化 web 框架，该 object 表示 web 框架：

如果 object 没有自身属性 web frame 标识符，则返回错误，其错误码为 invalid argument。
令 reference 为从 object 获取 web frame 标识符属性的结果。
如果 reference 不是 String，则返回一个错误，其错误码为 invalid argument。
令 browsing context 为窗口句柄是 reference 的浏览上下文；如果不存在这样的浏览上下文，则为 null。
如果 browsing context 为 null，或是顶级浏览上下文，则返回错误，其错误码为 no such frame。
返回成功，其数据为 browsing context 的关联窗口。

为了通过一个 JSON Object object 来反序列化 web 窗口，该 object 表示 web 窗口：

如果 object 没有自身属性 web window 标识符，则返回错误，其错误码为 invalid argument。
令 reference 为从 object 获取 web window 标识符属性的结果。
如果 reference 不是 String，则返回一个错误，其错误码为 invalid argument。
令 browsing context 为窗口句柄是 reference 的浏览上下文；如果不存在这样的浏览上下文，则为 null。
如果 browsing context 为 null，或者不是顶级浏览上下文，则返回错误，其错误码为 no such window。
返回成功，其数据为 browsing context 的关联窗口。

当要求给定 session 和 context 设置当前浏览上下文时，实现必须遵循以下步骤：

将 session 的当前浏览上下文设置为 context。
将 session 的当前父浏览上下文设置为 context 的父浏览上下文，如果该上下文存在；否则设置为null。

当要求给定 session 和 context 设置当前顶级浏览上下文时，实现必须：

断言：context 是顶级浏览上下文。
将 session 的当前顶级浏览上下文设置为 context。
使用 session 和 context 设置当前浏览上下文。

注

根据 [HTML] 规范的焦点小节，命令不受操作系统窗口是否具有焦点的影响。

HTTP 方法	URI 模板
GET	/session/{`session id`}/window

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
返回成功，其数据为与 session 的当前顶级浏览上下文关联的窗口句柄。

MDN

Commands/CloseWindow

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
DELETE	/session/{`session id`}/window

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
关闭 session 的当前顶级浏览上下文。
如果不再有打开的顶级浏览上下文，则try 去关闭会话。
返回为获取窗口句柄列表命令运行远程端步骤的结果，参数为 session、URL variables 和 parameters。

HTTP 方法	URI 模板
POST	/session/{`session id`}/window

注

切换窗口会选择 session 的当前顶级浏览上下文，将其用作所有后续命令的目标。在标签页式浏览器中，这通常会使包含该浏览上下文的标签页成为选中的标签页。

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 handle 为从 parameters 获取属性 "handle" 的结果。
如果 handle 为undefined，则返回错误，其错误码为 invalid argument。
如果存在活动的用户提示，它会阻止聚焦另一个顶级浏览上下文，则返回错误，其错误码为 unexpected alert open。
如果 handle 等于某个顶级浏览上下文的关联窗口句柄，则令 context 为该浏览上下文，并使用 session 和 context 设置当前顶级浏览上下文。

否则，返回错误，其错误码为 no such window。
更新任何由用户选择 session 的当前浏览上下文进行交互而产生的实现特定状态，且不改变 OS 级焦点。
返回成功，其数据为null。

MDN

Commands/GetWindowHandles

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
GET	/session/{`session id`}/window/handles

窗口句柄返回的顺序是任意的。

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 handles 为一个 List。
对于远程端中的每个顶级浏览上下文，将关联的窗口句柄推入 handles。
返回成功，其数据为 handles。

MDN🚫

Commands/New_Window

此特性的支持有限。

Chrome	否
Chrome Android	?
Edge	?
Edge Mobile	?
Firefox	66+
Firefox Android	?
Opera	?
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
POST	/session/{`session id`}/window/new

创建新的顶级浏览上下文。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果实现不支持创建新的顶级浏览上下文，则返回错误，其错误码为 unsupported operation。
如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 type hint 为从 parameters 获取属性 "type" 的结果。
通过运行 window open steps 创建新的顶级浏览上下文，其中 URL 设置为 "about:blank"，target 设置为空字符串，features 设置为 "noopener"，并且用户代理被配置为创建新的浏览上下文。这必须在不为所创建的浏览上下文调用聚焦步骤的情况下完成。如果 type hint 的值为 "tab"，且实现支持在同一个 OS 窗口中存在多个浏览上下文，则新的浏览上下文应与 session 的当前浏览上下文共享一个 OS 窗口。如果 type hint 为 "window"，且实现支持在不同 OS 窗口中存在多个浏览上下文，则所创建的浏览上下文应位于新的 OS 窗口中。在所有其他情况下，浏览上下文如何呈现给用户的细节都是实现定义的。
令 handle 为新创建窗口的关联窗口句柄。
如果新创建的窗口与 session 的当前浏览上下文共享 OS 级窗口，则令 type 为 "tab"；否则为 "window"。
令 result 为一个新的 JSON Object，使用以下内容初始化：

"handle"

handle 的值。

"type"

type 的值。
返回成功，其数据为 result。

HTTP 方法	URI 模板
POST	/session/{`session id`}/frame

注

切换到框架命令用于选择 session 的当前顶级浏览上下文，或 session 的当前浏览上下文的子浏览上下文，将其用作 session 后续命令的当前浏览上下文。给定 session、URL variables 和 parameters 时，远程端步骤为：

令 id 为从 parameters 获取属性 "id" 的结果。
如果 id 不是null、 Number 对象，或表示 web 元素的Object，则返回错误，其错误码为 invalid argument。
运行第一个匹配条件的子步骤：
id 是null
1. 如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
2. Try 使用 session 处理任何用户提示。
3. 使用 session 和 session 的当前顶级浏览上下文设置当前浏览上下文。
id 是 Number 对象
1. 如果 id 小于 0 或大于 2¹⁶ – 1，则返回错误，其错误码为 invalid argument。
2. 如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
3. Try 使用 session 处理任何用户提示。
4. 令 window 为 session 的当前浏览上下文的活动文档的关联窗口。
5. 如果 id 不是 window 的支持的属性索引，则返回错误，其错误码为 no such frame。
6. 令 child window 为通过调用 window.[[GetOwnProperty]] (id) 获得的WindowProxy 对象。
7. 使用 session 和 child window 的浏览上下文设置当前浏览上下文。
id 表示 web 元素
1. 如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
2. Try 使用 session 处理任何用户提示。
3. 令 element 为使用 session 和 id trying 去获取已知元素的结果。
4. 如果 element 不是 frame 或 iframe 元素，则返回错误，其错误码为 no such frame。
5. 使用 session 和 element 的内容 navigable的活动浏览上下文设置当前浏览上下文。
更新任何由用户选择 session 的当前浏览上下文进行交互而产生的实现特定状态，且不改变 OS 级焦点。
返回成功，其数据为null。

注

WebDriver 不受同源策略约束，因此始终可以切换到子浏览上下文，即使它们与当前浏览上下文不同源。

HTTP 方法	URI 模板
POST	/session/{`session id`}/frame/parent

注

切换到父框架命令将 session 未来命令的当前浏览上下文设置为 session 的当前浏览上下文的父级。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文已经是顶级浏览上下文：
1. 如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
2. 返回成功，其数据为null。
如果 session 的当前父浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
如果会话的当前父浏览上下文不是 null，则使用 session 和当前父浏览上下文设置当前浏览上下文。
更新任何由用户选择 session 的当前浏览上下文进行交互而产生的实现特定状态，且不改变 OS 级焦点。
返回成功，其数据为null。

WebDriver 提供命令，用于与包含 session 的当前顶级浏览上下文的操作系统窗口交互。由于不同操作系统的窗口管理器提供不同的能力，并非本节中的所有命令都能被所有远程端支持。对这些命令的支持由窗口尺寸调整/定位能力决定。当某个命令不受支持时，会返回unsupported operation 错误。

顶级浏览上下文具有关联的窗口状态，用于描述其 OS 小部件窗口处于何种可见性状态。它可以处于以下状态之一：

状态	关键字	默认	描述
最大化窗口状态	"`maximized`"		窗口已最大化。
最小化窗口状态	"`minimized`"		窗口已图标化。
普通窗口状态	"`normal`"	✓	窗口正常显示。
全屏窗口状态	"`fullscreen`"		窗口处于全屏模式。

如果出于任何原因，顶级浏览上下文的 OS 窗口无法进入任一窗口状态，或者此概念不适用于当前系统，则默认状态必须为 normal。

对于 WindowProxy window，WindowRect 对象是使用以下属性初始化的Object：

"x": window 的screenX 属性。
"y": window 的screenY 属性。
"width": windows 的outerWidth 属性。
"height": window 的outerHeight 属性。

给定一个具有关联顶级浏览上下文的操作系统级窗口，为了最大化窗口，运行实现特定步骤，将该操作系统级窗口转换到最大化窗口状态。如果窗口管理器支持调整窗口大小，但没有窗口最大化概念，则窗口尺寸必须增加到窗口管理器允许的当前屏幕的最大可用大小。当窗口完成转换时返回，或在实现定义的超时时间内返回。

给定一个具有关联顶级浏览上下文的操作系统级窗口，为了图标化窗口，运行实现特定步骤，将该操作系统级窗口转换到最小化窗口状态。在顶级浏览上下文的活动文档的可见性状态达到hidden 状态之前，或操作超时之前，不要从此操作返回。

给定一个具有关联顶级浏览上下文的操作系统级窗口，为了恢复窗口，运行实现特定步骤，将窗口恢复或取消隐藏到可见屏幕。在顶级浏览上下文的活动文档的可见性状态达到visible 状态之前，或操作超时之前，不要从此操作返回。

MDN

Commands/GetWindowRect

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
GET	/session/{session id}/window/rect

注

获取窗口矩形命令返回与 session 的当前顶级浏览上下文对应的操作系统窗口在屏幕上的大小和位置。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
返回成功，其数据设置为 session 的当前顶级浏览上下文的WindowRect 对象。

MDN

Commands/SetWindowRect

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
POST	/session/{`session id`}/window/rect

注

设置窗口矩形命令会改变与 session 的当前顶级浏览上下文对应的操作系统窗口的大小和位置。

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 width 为从 parameters 获取名为 "width" 的属性的结果。
如果 width 为undefined，则令 width 为 null。
令 height 为从 parameters 获取名为 "height" 的属性的结果。
如果 height 为undefined，则令 height 为 null。
令 x 为从 parameters 获取名为 "x" 的属性的结果。
如果 x 为undefined，则令 x 为 null。
令 y 为从 parameters 获取名为 "y" 的属性的结果。
如果 y 为undefined，则令 y 为 null。
如果 width 或 height 既不是 null，也不是 0 到 2³¹ − 1 范围内的 Number，则返回错误，其错误码为 invalid argument。
如果 x 或 y 既不是 null，也不是 −(2³¹) 到 2³¹ − 1 范围内的 Number，则返回错误，其错误码为 invalid argument。
如果远程端出于任何原因不支持针对 session 的当前顶级浏览上下文的设置窗口矩形命令，则返回错误，其错误码为 unsupported operation。

注

在设置窗口矩形命令受到部分支持的情况下（即支持某些参数组合，但不支持其他组合），预期实现会继续执行剩余步骤。
如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
完全退出全屏。
恢复窗口。
令 window 为包含 session 的当前顶级浏览上下文的操作系统窗口
如果实现能够设置 window 的尺寸：
1. 如果 width 不为 null，则将 window 的宽度（以 CSS 像素为单位），包括任何浏览器 chrome和外部绘制的窗口装饰，设置为尽可能接近 width 的值。
2. 如果 height 不为 null，则将 window 的高度（以 CSS 像素为单位），包括任何浏览器 chrome和外部绘制的窗口装饰，设置为尽可能接近 height 的值。
注

本规范不保证结果窗口大小会与请求的大小完全匹配。特别是，实现预期会钳制大于物理屏幕尺寸的值，或小于最小窗口大小的值。

特定实现可能还有其他限制，例如无法以单个像素为增量调整大小。

这旨在改变 session 的当前顶级浏览上下文的WindowProxy的 outerWidth 和 outerHeight 属性的值。具体而言，outerWidth 的值应尽可能接近 width，而 outerHeight 的值应尽可能接近 height。
如果实现能够设置 window 的位置：
1. 如果 x 不为 null，则将 window 左边缘的 x 坐标设置为尽可能接近 x 的值。
2. 如果 y 不为 null，则将 window 顶部边缘的 y 坐标设置为尽可能接近 y 的值。
注
本规范不保证结果窗口位置会与请求的位置匹配。

此步骤类似于在与 session 的当前顶级浏览上下文关联的WindowProxy 对象上调用 moveTo(x, y) 方法，但没有以下安全限制：
1. 不能移动不是由 window.open 创建的窗口或标签页。
2. 当窗口或标签页位于包含多个标签页的窗口中时，不能移动它。
返回成功，其数据设置为 session 的当前顶级浏览上下文的WindowRect 对象。

HTTP 方法	URI 模板
POST	/session/{`session id`}/window/maximize

注

最大化窗口命令会在包含 session 的当前顶级浏览上下文的窗口上调用窗口管理器特定的“最大化”操作（如果有）。这通常会将窗口增大到最大可用大小，而不会进入全屏。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果远程端出于任何原因不支持针对 session 的当前顶级浏览上下文的最大化窗口命令，则返回错误，其错误码为 unsupported operation。
如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
完全退出全屏。
恢复窗口。
最大化窗口，该窗口为 session 的当前顶级浏览上下文的窗口。
返回成功，其数据设置为 session 的当前顶级浏览上下文的WindowRect 对象。

HTTP 方法	URI 模板
POST	/session/{`session id`}/window/minimize

注

最小化窗口命令会在包含 session 的当前顶级浏览上下文的窗口上调用窗口管理器特定的“最小化”操作（如果有）。这通常会在系统托盘中隐藏窗口。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果远程端出于任何原因不支持针对 session 的当前顶级浏览上下文的最小化窗口命令，则返回错误，其错误码为 unsupported operation。
如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
完全退出全屏。
图标化窗口。
返回成功，其数据设置为 session 的当前顶级浏览上下文的WindowRect 对象。

HTTP 方法	URI 模板
POST	/session/{`session id`}/window/fullscreen

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果远程端不支持全屏，则返回错误，其错误码为 unsupported operation。
如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
恢复窗口。
以 session 的当前顶级浏览上下文的活动文档的文档元素调用 fullscreen an element。

注

窗口现在处于全屏窗口状态。
返回成功，其数据设置为 session 的当前顶级浏览上下文的WindowRect 对象。

web 元素是一种抽象，用于在通过协议、在远程端与本地端之间传输时，标识一个元素。

web element 标识符是字符串常量 "element-6066-11e4-a52e-4f735466cecf"。

如果 ECMAScript Object 具有一个web element 标识符自身属性，则该对象表示 web 元素。

WebDriver 节点 ID是一个全局唯一字符串，表示特定 WebDriver 会话中 DOM 节点的句柄。

弱映射是一个映射，其中键被弱持有，即如果键对象被垃圾回收，则移除相应项，并且映射中的存在不会阻止垃圾回收。这可作为直接在键对象上定义属性的替代方式。

注

与 ECMAScript WeakMap 不同，弱映射可以参与 Map 可用的完整操作集。

WebDriver 会话有一个浏览上下文组节点映射，它是浏览上下文组和节点 ID 映射之间的弱映射。

节点 ID 映射是节点和其对应 WebDriver 节点 ID之间的弱映射。

WebDriver 会话有一个可导航对象已见节点映射，它是可导航对象和集合之间的弱映射。

要在给定 session、 browsing context 和 reference 时获取节点：

令 browsing context group node map 为 session 的浏览上下文组节点映射。
令 browsing context group 为 browsing context 的浏览上下文组。
如果 browsing context group node map 不包含 browsing context group，则返回 null。
令 node id map 为 browsing context group node map[browsing context group]。
令 node 为 node id map 中其值为 reference 的项；如果存在这样的项，则为该项，否则为 null。
返回 node。

为了给定 session、browsing context 和 node 来获取或创建节点引用：

令 browsing context group node map 为 session 的浏览上下文组节点映射。
令 browsing context group 为 browsing context 的浏览上下文组。
如果 browsing context group node map 不包含 browsing context group，则将 browsing context group node map[browsing context group] 设置为一个新的weak map。
令 node id map 为 browsing context group node map[browsing context group]。
如果 node id map 不包含 node：
1. 令 node id 为一个新的全局唯一字符串。
2. 将 node id map[node] 设置为 node id。
3. 令 navigable 为 browsing context 的活动文档的node navigable。
4. 令 navigable seen nodes map 为 session 的navigable seen nodes map。
5. 如果 navigable seen nodes map 不包含 navigable，则将 navigable seen nodes map[navigable] 设置为空集合。
6. 将 node id 追加到 navigable seen nodes map[navigable]。
返回 node id map[node]。

给定 session、browsing context 和 reference 时，如果以下步骤返回 true，则节点引用是已知的：

令 navigable 为 browsing context 的活动文档的node navigable。
令 navigable seen nodes map 为 session 的navigable seen nodes map。
如果 navigable seen nodes map 包含 navigable，并且 navigable seen nodes map[navigable] 包含 reference，则返回 true，否则返回 false。

为了给定 session 和 reference 来获取已知元素：

如果在 session、 session 的当前浏览上下文和 reference 下节点引用是已知的不成立，则返回错误，其错误码为 no such element。
令 node 为使用 session、session 的当前浏览上下文和 reference 获取节点的结果。
如果 node 不为 null，且 node 未实现 Element，则返回错误，其错误码为 no such element。
如果 node 为 null，或 node 已过时，则返回错误，其错误码为 stale element reference。
返回成功，其数据为 node。

为了给定 session 和element 来获取或创建 web 元素引用：

断言：element 实现了 Element。
返回使用给定的 session、session 的当前浏览上下文和 element trying 去获取或创建节点引用的结果。

session 和 element 的web 元素引用对象是：

令 identifier 为web element 标识符。
令 reference 为使用 session 和 element 获取或创建 web 元素引用的结果。
返回一个 JSON Object，该对象以一个属性初始化，其名称为 identifier，值为 reference。

为了通过一个 JSON Object object 来反序列化 web 元素，该 object 表示 web 元素：

如果 object 没有自身属性 web element 标识符，则返回错误，其错误码为 invalid argument。
令 reference 为从 object 获取 web element 标识符属性的结果。
如果 reference 不是 String，则返回一个错误，其错误码为 invalid argument。
令 element 为使用 session 和 reference trying 去获取已知元素的结果。
返回成功，其数据为 element。

一个元素是失效的，如果其节点文档不是活动文档，或者它未连接。

为了将一个元素滚动到视图中，仅当该元素尚未在视图中时，执行以下步骤：

令 options 为以下 ScrollIntoViewOptions：

"behavior"

"instant"

逻辑滚动位置 "block"

"end"

逻辑滚动位置 "inline"

"nearest"
以 element 作为 this 值运行 Function.[[Call]](scrollIntoView, options)。

可编辑元素是可用于键入和清除的元素，它们分为两个子类别：

可变表单控件元素

表示 input 元素，它们是可变的（例如不是只读或禁用的），并且其 type 属性处于以下状态之一：

Text and Search
URL
Telephone
Email
Password
Date
Month
Week
Time
Local Date and Time
Number
Range
Color
File Upload

以及 textarea 元素。

可变元素

表示作为编辑宿主或content editable的元素。

如果一个元素的 "pointer-events" 样式属性的解析值是 "none"，则称该元素具有 pointer events disabled。

如果一个元素是 input 元素，并且其 readonly 属性已设置，则该元素被视为只读。

为了确定一个元素是否可以使用指针操作与之交互， WebDriver 会执行命中测试以找出该交互是否能够到达所请求的元素。

可交互元素是一个元素，它要么是指针可交互，要么是键盘可交互。

指针可交互元素定义为在其矩形中位于视口内部的中心点处，按绘制顺序找到的第一个元素，不包括任何已渲染滚动条的尺寸。

键盘可交互元素是任何具有可聚焦区域的元素，或者是 body 元素，或者是文档元素。

元素的视图内中心点是以下矩形的原点位置：该矩形是元素第一个由 getClientRects() 返回的DOMRect 与初始视口之间的交集。它可以按如下方式计算：

令 rectangle 为在element 上调用 getClientRects() 返回的 DOMRect 集合中的第一个对象。
令 left 为 max(0, min(x 坐标, x 坐标 + 宽度维度))。
令 right 为 min(innerWidth, max(x 坐标, x 坐标 + 宽度维度))。
令 top 为 max(0, min(y 坐标, y 坐标 + 高度维度))。
令 bottom 为 min(innerHeight, max(y 坐标, y 坐标 + 高度维度))。
令 x 为 floor((left + right) ÷ 2.0)。
令 y 为 floor((top + bottom) ÷ 2.0)。
返回 (x, y) 对。

如果以下步骤返回 true，则元素 element 是禁用的：

如果 element 是 option 元素，或 element 是 optgroup 元素：
1. 对于 element 的每个包含祖先 ancestor：
  1. 如果 ancestor 是 optgroup 元素，或 ancestor 是 select 元素，并且 ancestor 实际禁用，则返回 true。
2. 返回 false。
返回 element 实际禁用。

如果一个元素是其自身指针可交互绘制树的成员，并假定其指针事件未被禁用，则该元素在视图中。

如果一个元素在其中心点处的指针可交互绘制树为空，或者此树中的第一个元素不是其自身的包含后代，则该元素被遮挡。

示例 10

这用于确定是否可以与元素的视图内中心点进行交互。

例如，在此按钮的中心点处的绘制树，即红色方块，既不是按钮本身，也不是按钮的后代。换言之，它不是 包含后代。这会使按钮被遮挡：

另一方面，以下 select 列表的中心点是第三个 option 元素，因为不同于下拉列表， <select multiple> 的选项是单独可见且被绘制的。因为该 option 是 select 元素的后代，所以它未被遮挡：

元素 element 的指针可交互绘制树按以下方式生成：

如果 element 与 session 的当前浏览上下文的活动文档不在同一树中，则返回一个空序列。
令 rectangles 为在 element 上调用 getClientRects() 所返回的 DOMRect 序列。
如果 rectangles 的长度为 0，则返回一个空序列。
令 center point 为 element 的视口内中心点。
给定坐标 center point，返回点处的元素。

shadow root 是一种抽象，用于在通过协议、在远程端与本地端之间传输时，标识一个shadow root。

shadow root 标识符是字符串常量 "shadow-6066-11e4-a52e-4f735466cecf"。

如果 ECMAScript Object 具有一个shadow root 标识符自身属性，则该对象表示 shadow root。

为了给定 session 和 reference 来获取已知 shadow root：

如果在 session、 session 的当前浏览上下文和 reference 下节点引用是已知的不成立，则返回错误，其错误码为 no such shadow root。
令 node 为使用 session、session 的当前浏览上下文和 reference 获取节点的结果。
如果 node 不为 null，且 node 未实现 ShadowRoot，则返回错误，其错误码为 no such shadow root。
如果 node 为 null，或 node 已分离，则返回错误，其错误码为 detached shadow root。
返回成功，其数据为 node。

为了给定 session 和 shadow root 来获取或创建 shadow root 引用：

断言：element 实现了 ShadowRoot。
返回使用 session、session 的当前浏览上下文和 element trying 去获取或创建节点引用的结果。

session 和 shadow root 的shadow root 引用对象由以下给出：

令 identifier 为shadow root 标识符。
令 reference 为使用 session 和 shadow root 获取或创建 shadow root 引用的结果。
返回一个 JSON Object，该对象以一个属性初始化，其名称为 identifier，值为 reference。

当要求通过一个 JSON Object object 来反序列化 shadow root，该 object 表示 shadow root：

如果 object 没有自身属性 shadow root 标识符，则返回错误，其错误码为 invalid argument。
令 reference 为从 object 获取 shadow root 标识符属性的结果。
如果 reference 不是 String，则返回一个错误，其错误码为 invalid argument。
令 shadow 为使用 session 和 reference trying 去获取已知 shadow root 的结果。
返回成功，其数据为 shadow。

如果一个shadow root的节点文档不是活动文档，或者称为其宿主的元素节点已过时，则该 shadow root 已分离。

查找元素、查找元素列表、从元素查找元素、从元素查找元素列表、从 Shadow Root 查找元素，以及从 Shadow Root 查找元素列表命令允许查找单个元素和元素集合。元素检索搜索会使用文档节点的先序遍历来执行，匹配所提供选择器的表达式。

当要求给定 session、start node、using 和 value 来查找时，远程端必须运行以下步骤：

令 location strategy 等于 using。
令 selector 等于 value。
令 timeout 为 session 的会话超时的隐式等待超时。
令 timer 为一个新的计时器。
如果 timeout 不为 null：
1. 使用 timer 和 timeout 启动计时器。
令 elements returned 为空List。
当 elements returned 为空且 timer 的timeout fired flag未设置时：
1. 将 elements returned 设置为使用参数 start node 和 selector trying 调用相关元素定位策略的结果。
2. 如果在执行元素定位策略期间出现 DOMException、SyntaxError、 XPathException，或其他错误，则返回错误 invalid selector。
令 result 为空List。
对于 elements returned 中的每个 element，将 session 和 element 的web 元素引用对象追加到 result。
返回成功，其数据为 result。

元素定位策略是一个枚举属性，决定应使用何种技术在 session 的当前浏览上下文中搜索元素。以下定位策略表列出了为此属性定义的关键字和状态：

状态	关键字
CSS 选择器	"`css selector`"
链接文本选择器	"`link text`"
部分链接文本选择器	"`partial link text`"
标签名称	"`tag name`"
XPath 选择器	"`xpath`"

为了使用 CSS 选择器策略查找web 元素，需要完成以下步骤：

令 elements 为以 start node 作为this、 selector 作为参数调用 querySelectorAll() 的结果。如果这导致抛出异常，则返回错误，其错误码为 invalid selector。
返回成功，其数据为 elements。

为了使用链接文本策略查找web 元素，需要完成以下步骤：

令 elements 为以 start node 作为this、 "a" 作为参数调用 querySelectorAll() 的结果。如果这抛出异常，则返回错误，其错误码为 unknown error。
令 result 为空NodeList。
对于 elements 中的每个 element：
1. 令 rendered text 为通过对 element 调用获取元素文本会返回的值。
2. 令 trimmed text 为从字符串 rendered text 的开头和结尾移除所有空白的结果。
3. 如果 trimmed text 等于 selector，则将 element 追加到 result。
返回成功，其数据为 result。

部分链接文本策略与链接文本策略非常相似，但它不是匹配整个字符串，而是只需要匹配一个子字符串。也就是说，返回所有渲染文本包含选择器表达式的 a 元素。

为了使用部分链接文本策略查找web 元素，需要完成以下步骤：

令 elements 为以 start node 作为this、 "a" 作为参数调用 querySelectorAll() 的结果。如果这抛出异常，则返回错误，其错误码为 unknown error。
令 result 为空NodeList。
对于 elements 中的每个 element：
1. 令 rendered text 为通过对 element 调用获取元素文本会返回的值。
2. 如果 rendered text 包含 selector，则将 element 追加到 result。
返回成功，其数据为 result。

为了使用标签名称策略查找web 元素，返回成功，其数据设置为以 start node 作为this、selector 作为参数调用 getElementsByTagName() 的结果。

为了使用 XPath 选择器策略查找web 元素，需要完成以下步骤：

令 evaluateResult 为使用参数 selector、 start node、 null、 ORDERED_NODE_SNAPSHOT_TYPE 和 null 调用 evaluate 的结果。

注

使用快照是为了提升操作的原子性。
令 index 为 0。
令 length 为从 evaluateResult 获取属性 "snapshotLength" 的结果。如果这抛出 XPathException，则返回错误，其错误码为 invalid selector；否则，如果这抛出任何其他异常，则返回错误，其错误码为 unknown error。
令 result 为空NodeList。
当 index 小于 length 时，重复：
1. 令 node 为以 evaluateResult 作为this、index 作为参数调用 snapshotItem 的结果。
2. 如果 node 不是元素，则返回一个错误，其错误码为 invalid selector。
3. 将 node 追加到 result。
4. 将 index 增加 1。
返回成功，其数据为 result。

HTTP 方法	URI 模板
POST	/session/{`session id`}/element

注

查找元素命令用于在 session 的当前浏览上下文中查找一个元素，该元素可用作将来以元素为中心的命令的web 元素上下文。

例如，考虑以下伪代码，它检索 ID 为 #toremove 的元素，并将其用作注入脚本的参数，以便从 HTML 文档中移除它：

let body = session.find.css("#toremove");
session.execute("arguments[0].remove()", [body]);

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 location strategy 为从 parameters 获取名为 "using" 的属性的结果。
如果 location strategy 不是定位策略表中的关键字，则返回错误，其错误码为 invalid argument。
令 selector 为从 parameters 获取名为 "value" 的属性的结果。
如果 selector 为undefined，则返回错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 start node 为 session 的当前浏览上下文的文档元素。
如果 start node 是null，则返回错误，其错误码为 no such element。
令 result 为使用 session、start node、location strategy 和 selector trying 去查找的结果。
如果 result 为空，则返回错误，其错误码为 no such element。否则，返回 result 的第一个元素。

HTTP 方法	URI 模板
POST	/session/{`session id`}/elements

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 location strategy 为从 parameters 获取名为 "using" 的属性的结果。
如果 location strategy 不是定位策略表中的关键字，则返回错误，其错误码为 invalid argument。
令 selector 为从 parameters 获取名为 "value" 的属性的结果。
如果 selector 为undefined，则返回错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 start node 为 session 的当前浏览上下文的文档元素。
如果 start node 是null，则返回错误，其错误码为 no such element。
返回使用 session、 start node、location strategy 和 selector trying 去查找的结果。

HTTP 方法	URI 模板
POST	/session/{`session id`}/element/{`element id`}/element

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 location strategy 为从 parameters 获取名为 "using" 的属性的结果。
如果 location strategy 不是定位策略表中的关键字，则返回错误，其错误码为 invalid argument。
令 selector 为从 parameters 获取名为 "value" 的属性的结果。
如果 selector 为undefined，则返回错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 start node 为使用 session 和 URL variables["element id"] trying 去获取已知元素的结果。
令 result 为使用 session、start node、location strategy 和 selector trying 去查找的值。
如果 result 为空，则返回错误，其错误码为 no such element。否则，返回 result 的第一个元素。

HTTP 方法	URI 模板
POST	/session/{`session id`}/element/{`element id`}/elements

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 location strategy 为从 parameters 获取名为 "using" 的属性的结果。
如果 location strategy 不是定位策略表中的关键字，则返回错误，其错误码为 invalid argument。
令 selector 为从 parameters 获取名为 "value" 的属性的结果。
如果 selector 为undefined，则返回错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 start node 为使用 session 和 URL variables["element id"] trying 去获取已知元素的结果。
返回使用 session、 start node、location strategy 和 selector trying 去查找的结果。

HTTP 方法	URI 模板
POST	/session/{`session id`}/shadow/{`shadow id`}/element

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 location strategy 为获取名为 "using" 的属性的结果。
如果 location strategy 不是定位策略表中的关键字，则返回错误，其错误码为 invalid argument。
令 selector 为获取名为 "value" 的属性的结果。
如果 selector 为undefined，则返回错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
处理任何用户提示，如果其值为错误则返回该值。
令 start node 为使用 session 和 URL variables["shadow id"] trying 去获取已知 shadow root的结果。
令 result 为使用 session、start node、location strategy 和 selector trying 去查找的值。
如果 result 为空，则返回错误，其错误码为 no such element。否则，返回 result 的第一个元素。

HTTP 方法	URI 模板
POST	/session/{`session id`}/shadow/{`shadow id`}/elements

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 location strategy 为获取名为 "using" 的属性的结果。
如果 location strategy 不是定位策略表中的关键字，则返回错误，其错误码为 invalid argument。
令 selector 为获取名为 "value" 的属性的结果。
如果 selector 为undefined，则返回错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
处理任何用户提示，如果其值为错误则返回该值。
令 start node 为使用 session 和 URL variables["shadow id"] trying 去获取已知 shadow root的结果。
返回使用 session、 start node、location strategy 和 selector trying 去查找的结果。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/active

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 active element 为 session 的当前浏览上下文的文档元素的活动元素。
如果 active element 是非 null 的元素，则返回成功，其数据设置为 session 和 active element 的web 元素引用对象。

否则，返回错误，其错误码为 no such element。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/shadow

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
处理任何用户提示，如果其值为错误则返回该值。
令 element 为使用 session 和 URL variables[element id] trying 去获取已知元素的结果。
令 shadow root 为 element 的shadow root。
如果 shadow root 为 null，则返回错误，其错误码为 no such shadow root。
令 serialized 为 session 和 shadow root 的shadow root 引用对象。
返回成功，其数据为 serialized。

为了给定 session 和 element 来计算绝对位置：

令 rect 为调用 getBoundingClientRect() 返回的值。
令 window 为 session 的当前顶级浏览上下文的关联窗口。
令 x 为（window 的 scrollX + rect 的x 坐标）。
令 y 为（window 的 scrollY + rect 的y 坐标）。
返回 (x, y) 对。

为了确定节点是否与另一个节点 other 不在同一树中，运行以下子步骤：

如果该节点的节点文档不是 other 的节点文档，则返回 true。
如果以 other 作为参数调用该节点的 compareDocumentPosition() 的结果是 DOCUMENT_POSITION_DISCONNECTED (1)，则返回 true，否则返回 false。

element 的容器是：

处于有效元素上下文中的 option 元素

处于有效元素上下文中的 optgroup 元素

该element 的元素上下文，它由以下方式确定：

令 datalist parent 为从 element 反向遍历树时到达的第一个 datalist 元素；如果到达树的根，则为undefined。
令 select parent 为从 element 反向遍历树时到达的第一个 select 元素；如果到达树的根，则为undefined。
如果 datalist parent 是undefined，则元素上下文为 select parent。否则，元素上下文为 datalist parent。

处于无效元素上下文中的 option 元素

该元素没有容器。

否则

容器是该元素本身。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/selected

注

元素是否被选中命令确定被引用的元素是否已被选中。此操作只对 Checkbox 和 Radio Button 状态的 input 元素，或 option 元素有意义。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables[element id] trying 去获取已知元素的结果。
令 selected 为与第一个匹配语句对应的值：

element 是 input 元素，且具有一个处于 Checkbox 或 Radio Button 状态的 type 属性

element 的checkedness 的结果。

element 是 option 元素

element 的selectedness 的结果。

否则

False。
返回成功，其数据为 selected。

MDN

Commands/GetElementAttribute

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/attribute/{`name`}

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables 的 element id trying 去获取已知元素的结果。
令 name 为 URL variables["name"]。
令 result 为第一个匹配条件的结果：

如果 name 是布尔属性

如果 element 使用 name 调用 hasAttribute()，则为 "true"（字符串），否则为null。

否则

按名称 name 获取属性的结果。
返回成功，其数据为 result。

注

请注意，此命令的行为偏离了 [DOM] 中 getAttribute() 的行为，后者在设置了布尔属性的情况下会返回空字符串。此命令之所以返回字符串形式的 true，是因为这在大多数动态类型编程语言中会求值为 true，但仍保留预期的类型信息。

MDN

Commands/GetElementProperty

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/property/{`name`}

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables 的 element id trying 去获取已知元素的结果。
令 name URL variables["name"]。
令 property 为在 element 上调用 Object.[[GetProperty]](name) 的结果。
令 result 为 property 的值（如果不是undefined），否则为null。
返回成功，其数据为 result。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/css/{`property name`}

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 URL variables["element id"] trying 去获取已知元素的结果。
令 computed value 为第一个匹配条件的结果：

session 的当前浏览上下文的活动文档的类型不是 "xml"

来自 element 样式声明的参数 URL variables["property name"] 的计算值。

否则

""（空字符串）
返回成功，其数据为 computed value。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/text

注

获取元素文本命令旨在返回一个元素“按渲染方式”的文本。元素的渲染文本也用于按链接文本和部分链接文本定位 a 元素。

本规范的主要输入之一是开源 Selenium 项目。在编写本规范之前，它已被广泛使用，因而已经设定了用户对获取元素文本命令应如何工作的预期。因此，此处提出的方法已知存在缺陷，但它为现有用户提供了最佳兼容性。

处理文本时，空白被定义为 Unicode 字符数据库中具有 Unicode 字符属性 "WSpace=Y" 或 "WS" 的字符。 [UAX44]

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables[element id] trying 去获取已知元素的结果。
令 rendered text 为执行实现特定步骤的结果，该结果与以 bot.dom.getVisibleText 作为 this 值，对 Function.[[Call]](null, element) 的结果完全相同。
返回成功，其数据为 rendered text。

MDN

Commands/GetElementTagName

Chrome	65+
Chrome Android	否
Edge	?
Edge Mobile	?
Firefox	55+
Firefox Android	否
Opera	否
Opera Android	?
Safari	否
Safari iOS	?
Samsung Internet	否
WebView Android	?

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/name

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 URL variables["element id"] trying 去获取已知元素的结果。
令 qualified name 为获取 element 的 tagName IDL 属性的结果。
返回成功，其数据为 qualified name。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/rect

注

获取元素矩形命令返回给定web 元素的尺寸和坐标。返回值是具有以下属性的对象：

"x": web 元素左上角相对于 session 的当前浏览上下文的文档元素的 X 轴位置，以 CSS 像素为单位。
"y": web 元素左上角相对于 session 的当前浏览上下文的文档元素的 Y 轴位置，以 CSS 像素为单位。
"height": web 元素的边界矩形的高度，以 CSS 像素为单位。
"width": web 元素的边界矩形的宽度，以 CSS 像素为单位。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables["element id"] trying 去获取已知元素的结果。
令 coordinates 为使用 session 和 element 计算绝对位置的结果。
令 rect 为 element 的边界矩形。
令 body 为一个新的 JSON Object，用以下内容初始化：

"x"

coordinates 的第一个值。

"y"

coordinates 的第二个值。

"width"

rect 的宽度维度的值。

"height"

rect 的高度维度的值。
返回成功，其数据为 body。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/enabled

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables[element id] trying 去获取已知元素的结果。
如果 session 的当前浏览上下文的活动文档的类型不是 "xml"，则令 enabled 为一个初始设置为 true 的布尔值。

否则，令 enabled 为 false，并跳转到此算法的最后一步。
如果表单控件禁用，则将 enabled 设置为 false。
返回成功，其数据为 enabled。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/computedrole

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 URL variables["element id"] trying 去获取已知元素的结果。
令 role 为计算 element 的 WAI-ARIA 角色的结果。
返回成功，其数据为 role。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/computedlabel

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables["element id"] trying 去获取已知元素的结果。
令 label 为对 element 的可访问名称执行可访问名称和描述计算的结果。
返回成功，其数据为 label。

元素交互命令提供了一组用于操作表单控件的高级指令集。不同于操作，它们会隐式地将元素滚动到视图中，并检查它是一个可交互元素。

某些可重置元素定义了自己的清除算法。不同于其关联的重置算法，作为这些算法的一部分对表单控件所做的更改确实计为由用户导致的更改（因此，例如确实会导致 input 事件触发）。当为没有定义自己的清除算法的元素调用清除算法时，必须改为调用其重置算法。

input 元素的清除算法是将脏值标志和脏选中性标志恢复为 false，将元素的值设置为空字符串，如果元素具有 checked 内容属性，则将元素的选中性设置为 true，如果没有则设置为 false，清空选定文件列表，然后当且仅当 type 属性的当前状态定义了一个值清理算法时调用它。

textarea 元素的清除算法是将脏值标志恢复为 false，并将元素的原始值设置为空字符串。

output 元素的清除算法是将元素的值模式标志设置为 default，然后将元素的 textContent IDL 属性设置为空字符串（从而清除元素的子节点）。

HTTP 方法	URI 模板
POST	/session/{`session id`}/element/{`element id`}/click

注

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 element id trying 去获取已知元素的结果。
如果 element 是处于文件上传状态的 input 元素，则返回错误，其错误码为 invalid argument。
将 element 的容器滚动到视图中。
如果 element 的容器仍不在视图中，则返回错误，其错误码为 element not interactable。
如果 element 的容器被另一个元素遮挡，则返回错误，其错误码为 element click intercepted。
对 element 进行匹配：
option 元素
1. 令 parent node 为 element 的容器。
2. 在 parent node 上触发一个 mouseOver 事件。
3. 在 parent node 上触发一个 mouseMove 事件。
4. 在 parent node 上触发一个 mouseDown 事件。
5. 在 parent node 上运行聚焦步骤。
6. 如果 element 未禁用：
  1. 在 parent node 上触发一个 input 事件。
  2. 令 previous selectedness 等于 element 的选中性。
  3. 如果 element 的容器具有 multiple 属性，则通过将 element 的选中性状态设置为其当前选中性的相反值来切换它。
    
    否则，将 element 的选中性状态设置为 true。
  4. 如果 previous selectedness 为 false，则在 parent node 上触发一个 change 事件。
7. 在 parent node 上触发一个 mouseUp 事件。
8. 在 parent node 上触发一个 click 事件。
否则
1. 令 input state 为给定 session 和 session 的当前顶级浏览上下文来获取输入状态的结果。
2. 令 actions options 为一个新的操作选项，其中是元素原点步骤设置为表示 web 元素，且获取元素原点步骤设置为获取 WebElement 原点。
3. 令 input id 为生成 UUID的结果。
4. 令 source 为使用 input state 和 "pointer" 创建输入源的结果。
5. 使用 input state、input id 和 source 添加输入源。
6. 令 click point 为 element 的视图内中心点。
7. 令 pointer move action 为一个使用参数 input id、 "pointer" 和 "pointerMove" 构造的操作对象。
8. 在 pointer move action 上设置属性 x 为 0。
9. 在 pointer move action 上设置属性 y 为 0。
10. 在 pointer move action 上设置属性 origin 为 element。
11. 令 pointer down action 为一个使用参数 input id、 "pointer" 和 "pointerDown" 构造的操作对象。
12. 在 pointer down action 上设置属性 button 为 0。
13. 令 pointer up action 为一个使用参数 input id、 "pointer" 和 "pointerUp" 构造的操作对象。
14. 在 pointer up action 上设置属性 button 为 0。
15. 令 actions 为列表 «pointer move action, pointer down action, pointer up action»。
16. 使用 input state、actions、session 的当前浏览上下文和 actions options 分派操作列表。
17. 使用 input state 和 input id 移除输入源。
等待，直到用户代理事件循环已转动足够次数以处理上一步生成的 DOM 事件。
执行实现定义的步骤，以允许点击触发的任何导航开始。

注

并不总是清楚这会导致算法等待多久，并且也承认某些实现可能存在不可避免的竞态条件。其意图是允许新的导航尝试开始，以便算法中的下一步是有意义的。点击可能不会导致导航尝试，在这种情况下，实现定义的步骤可以立即返回，下一步也将立即返回。
Try 使用 session 等待导航完成。
Try 运行导航后检查。
返回成功，其数据为null。

HTTP 方法	URI 模板
POST	/session/{`session id`}/element/{`element id`}/clear

要清除 content editable 元素：

如果 element 的innerHTML IDL 属性是空字符串，则不执行任何操作并返回。
对 element 运行聚焦步骤。
将 element 的innerHTML IDL 属性设置为空字符串。
对 element 运行取消聚焦步骤。

要清除可重置元素：

令 empty 为第一个匹配条件的结果：

element 是 input 元素，且其 type 属性处于文件上传状态

如果选定文件列表的长度为 0，则为 True，否则为 false。

否则

如果其值 IDL 属性为空字符串，则为 True，否则为 false。
如果 element 是约束验证候选对象，且它满足其约束，并且 empty 为 true，则中止这些子步骤。
为 element 调用聚焦步骤。
为 element 调用清除算法。
为 element 调用取消聚焦步骤。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 element id trying 去获取已知元素的结果。
如果 element 不可编辑，则返回一个错误，其错误码为 invalid element state。
将 element 滚动到视图中。
令 timeout 为 session 的会话超时的隐式等待超时。
令 timer 为一个新的计时器。
如果 timeout 不为 null：
1. 使用 timer 和 timeout 启动计时器。
等待 element 变为可交互，或 timer 的timeout fired flag 被设置，以先发生者为准。
如果 element 不可交互，则返回错误，其错误码为 element not interactable。
运行第一个匹配语句的子步骤：

element 是可变表单控件元素

调用清除可重置元素的步骤。

element 是可变元素

调用清除 content editable 元素的步骤。

否则

返回错误，其错误码为 invalid element state。
返回成功，其数据为null。

HTTP 方法	URI 模板
POST	/session/{`session id`}/element/{`element id`}/value

注

元素发送按键命令将表单控件元素滚动到视图中，然后将提供的按键发送给该元素。如果该元素不是键盘可交互，则返回 element not interactable 错误。

不可键入表单控件是 input 元素，其 type 属性状态导致主要输入机制不是通过虚拟或物理键盘来完成。

不可键入表单控件意在指用户代理呈现为文本输入控件以外形式的表单控件元素。当目标是一个处于color 状态、并呈现为色轮的 input 元素时，将模拟与它的交互，而不是使用带操作的按键仿真来键入。

不可键入表单控件的其他示例包括通过系统原生小部件交互的表单控件，例如 select 元素的滚动选项列表，以及非桌面设备上处于number 状态的 input 元素的数字键盘。

用于输入的按键输入源可以在“键入”过程中通过发送null key来清除，该键为 U+E000 (NULL)。

为了在给定 input state、input id、source、undo actions 和 browsing context 时清除修饰键状态：

如果 source 不是按键输入源，则返回错误，其错误码为 invalid argument。
令 actions options 为一个新的操作选项，其中是元素原点步骤设置为表示 web 元素，且获取元素原点步骤设置为获取 WebElement 原点。
对于 undo actions 中按词法排序的键中的每个 entry key：
1. 令 action 为 undo actions 中等于键 entry key 的值。
2. 如果 action 不是类型为 "key" 且子类型为 "keyUp" 的操作对象，则返回错误，其错误码为 invalid argument。
3. 令 actions 为列表 «action»
4. 使用 input state、actions、browsing context 和操作选项分派操作列表。

如果一个扩展字素簇由单个 unicode 码点组成，且code 不是undefined，则它是可键入的。

keyboard 的shifted 状态是 keyboard 的 shift 属性的值。

为了在给定 input state、input id、source、 text 和 browsing context 时分派可键入字符串的事件：

令 actions options 为一个新的操作选项，其中是元素原点步骤设置为表示 web 元素，且获取元素原点步骤设置为获取 WebElement 原点。
对于 text 中的每个 char：
1. 令 global key state 为使用 input state 获取全局按键状态的结果。
2. 如果 char 是shifted 字符，且 source 的shifted 状态为 false：
  1. 令 action 为一个使用 input id、"key" 和 "keyDown" 构造的操作对象，并将其 value 属性设置为 U+E008 ("left shift")。
  2. 令 actions 为列表 «action»。
  3. 使用 input state、actions 和 browsing context 分派操作列表。
3. 如果 char 不是shifted 字符，且 source 的shifted 状态为 true：
  1. 令 action 为一个使用 input id、"key" 和 "keyUp" 构造的操作对象，并将其 value 属性设置为 U+E008 ("left shift")。
  2. 令 tick actions 为列表 «action»。
  3. 使用 input state、actions、browsing context 和 actions options 分派操作列表。
4. 令 keydown action 为一个使用参数 input id、"key" 和 "keyDown" 构造的操作对象。
5. 将 keydown action 的 value 属性设置为 char。
6. 令 keyup action 为 keydown action 的副本，其 subtype 属性改为 "keyUp"。
7. 令 actions 为列表 «keydown action, keyup action»。
8. 使用 input state、actions、browsing context 和 actions options 分派操作列表。

当要求在给定 type 和 cluster 以及 browsing context 的情况下分派 composition 事件时，远程端必须在 browsing context 上执行实现特定的操作分派步骤，其等价于按照 [UI-EVENTS] 的要求发送 composition 事件，并生成具有指定属性的以下事件。

具有以下属性的 composition event：

属性	值
`type`	`type`
`data`	`cluster`

为了在给定 input state、input id、source、 text、browsing context 和 actions options 时为字符串分派操作：

令 clusters 为通过将 text 分解为扩展字素簇创建的数组。
令 undo actions 为空映射。
令 current typeable text 为空列表。
对于 clusters 中与索引属性对应的每个 cluster，运行第一个匹配语句的子步骤：
cluster 是 null key
1. 使用 input state、input id、source、current typeable text 和 browsing context 分派可键入字符串的事件。清空 current typeable text。
2. Try 使用 input state、input id、source、 undo actions 和 browsing context 清除修饰键状态。
3. 清除 undo actions。
cluster 是修饰键
1. 使用 input state、input id、source、 current typeable text 和 browsing context 分派可键入字符串的事件。
2. 清空current typeable text。
3. 令 keydown action 为一个使用参数 input id、 "key" 和 "keyDown" 构造的操作对象。
4. 将 keydown action 的 value 属性设置为 cluster。
5. 令 actions 为列表 «keydown action»
6. 使用 input state、actions、browsing context 和 actions options 分派操作列表。
7. 向 undo actions 添加一个条目，其键为 cluster，其值为 keydown action 的副本，并将 subtype 属性修改为 "keyUp"。
cluster 是可键入的

将 cluster 追加到 current typeable text。

否则
1. 使用 input state、input id、source、 current typeable text 和 browsing context 分派可键入字符串的事件。
2. 清空 current typeable text。
3. 使用参数 "compositionstart"、undefined 和 browsing context 分派 composition event。
4. 使用参数 "compositionupdate"、cluster 和 browsing context 分派 composition event。
5. 使用参数 "compositionend"、cluster 和 browsing context 分派 composition event。
使用 input state、input id 和 source、current typeable text 和 browsing context 分派可键入字符串的事件。
Try 使用 input state、input id、source、 undo actions 和 browsing context 清除修饰键状态。

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 text 为从 parameters 获取名为属性 "text" 的结果。
如果 text 不是 String，则返回一个错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables[element id] trying 去获取已知元素的结果。
如果 element 是处于文件上传状态的 input 元素，则令 file 为 true；否则为 false。
如果 file 为 false，或者会话的严格文件可交互性为 true，则运行以下子步骤：
1. 将 element 滚动到视图中。
2. 令 timeout 为 session 的会话超时的隐式等待超时。
3. 令 timer 为一个新的计时器。
4. 如果 timeout 不为 null：
  1. 使用 timer 和 timeout 启动计时器。
5. 等待 element 变为键盘可交互，或 timer 的 timeout fired flag 被设置，以先发生者为准。
6. 如果 element 不是键盘可交互，则返回错误，其错误码为 element not interactable。
7. 如果 element 不是活动元素，则为 element 运行聚焦步骤。
运行第一个匹配条件的子步骤：
file 为 true
1. 令 files 为按换行符（\n）拆分 text 的结果。
2. 如果 files 的长度为 0，则返回一个错误，其错误码为 invalid argument。
3. 令 multiple 等于在 element 上使用 "multiple" 调用 hasAttribute() 的结果。
4. 如果 multiple 是 false，且 files 的长度不等于 1，则返回一个错误，其错误码为 invalid argument。
5. 验证用户给定的每个文件是否存在。如果有任何文件不存在，则返回错误，其错误码为 invalid argument。
6. 完成实现特定步骤，其等价于在 input 元素上设置选定文件。如果 multiple 是 true，则将 files 追加到 element 的选定文件中。
7. 在 element 上按顺序触发这些事件：
  1. input
  2. change
8. 返回成功，其数据为null。
element 是不可键入表单控件
1. 如果 element 没有名为 value 的自身属性，则返回一个错误，其错误码为 element not interactable
2. 如果 element 不可变，则返回一个错误，其错误码为 element not interactable。
3. 在 element 上设置属性 value 为 text。
4. 如果 element 遭受错误输入，则返回一个错误，其错误码为 invalid argument。
5. 返回成功，其数据为null。
element 是content editable

如果 element 当前没有获得焦点，则在任何子内容之后设置文本插入光标。

否则
1. 如果 element 当前没有获得焦点，则令 current text length 为 element 的API 值的长度。
2. 使用 current text length 作为 start 和 end 参数，通过设置选择范围来设置文本插入光标。
令 input state 为使用 session 和 session 的当前顶级浏览上下文获取输入状态的结果。
令 input id 为生成 UUID的结果。
令 source 为使用 input state 和 "key" 创建输入源的结果。
使用 input state、input id 和 source 添加输入源。
以 input state、input id 和 source、 text 以及 session 的当前浏览上下文作为参数，为字符串分派操作。
使用 input state 和 input id 移除输入源。
返回成功，其数据为null。

HTTP 方法	URI 模板
GET	/session/{`session id`}/source

注

获取页面源码命令返回 session 的当前浏览上下文的活动文档的 DOM 字符串序列化结果。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 source 为在一个虚构节点上调用片段序列化算法的结果，该虚构节点唯一的子节点是文档元素，并为 require well-formed 标志提供 true。如果这导致抛出异常，则令 source 为null。
如果 source 为null，则令 source 为将 session 的当前浏览上下文的活动文档序列化为字符串的结果。
返回成功，其数据为 source。

集合是一个实现 Iterable 接口的Object，且其满足：

toString 自身属性的初始值是 "Arguments"
是 Array 的实例
是 DOMTokenList 的实例
是 FileList 的实例
是 HTMLAllCollection 的实例
是 HTMLCollection 的实例
是 HTMLFormControlsCollection 的实例
是 HTMLOptionsCollection 的实例
是 NodeList 的实例

为了在给定 session、value 和可选参数 seen 时JSON 反序列化，远程端必须运行以下步骤：

如果未提供 seen，则令 seen 为空List。
跳转到下面第一个适用的步骤：
对 value 进行匹配：

undefined

null

类型为 Boolean

类型为 Number

类型为 String

返回成功，其数据为 value。

Object，其表示 web 元素

返回 value 的反序列化 web 元素。

Object，其表示 shadow root

返回 value 的反序列化 shadow root。

Object，其表示 web frame

返回 value 的反序列化 web frame。

Object，其表示 web window

返回 value 的反序列化 web window。

Array 的实例

Object 的实例

返回使用 session、value 和 seen，并以 JSON 反序列化算法作为克隆算法的克隆对象算法。

为了在给定 session 和 value 时JSON 克隆，返回使用 session、value 和空List 内部 JSON 克隆的结果。

为了在给定 session、value 和 seen 时进行内部 JSON 克隆，对 value 进行匹配，返回第一个匹配语句的值：

undefined

null

返回成功，其数据为null。

类型为 Boolean

类型为 Number

类型为 String

返回成功，其数据为 value。

Element 的实例

如果 element 已过时，则返回错误，其错误码为 stale element reference。

否则：

令 reference 为 session 和 value 的web 元素引用对象。
返回成功，其数据为 reference。

ShadowRoot 的实例

如果 shadow root 已分离，则返回错误，其错误码为 detached shadow root。

否则：

令 reference 为 session 和 value 的shadow root 引用对象。
返回成功，其数据为 reference。

一个 WindowProxy 对象

如果 value 中 WindowProxy 对象的关联浏览上下文已被销毁，则返回错误，其错误码为 stale element reference。

否则：

令 reference 为 value 的WindowProxy 引用对象。
返回成功，其数据为 reference。

具有一个名为 "toJSON"、且为 Function 的自身属性

返回成功，其数据为以 value 作为 this 值调用 Function.[[Call]](toJSON) 返回的值。

否则

令 result 为使用 session、 value 和 seen，并以内部 JSON 克隆作为 clone algorithm，克隆对象的结果。
返回成功，其数据为 result。

为了给定 session、value、 seen 和 clone algorithm 来克隆对象：

如果 value 在 seen 中，则返回错误，其错误码为 javascript error。
将 value 追加到 seen。
令 result 为第一个匹配语句的值，对 value 进行匹配：

一个集合

一个新的 Array，其 length 属性等于从 value 获取属性 length 的结果。

否则

一个新的 Object。
对于 value 中的每个可枚举属性，运行以下子步骤：
1. 令 name 为该属性的名称。
2. 令 source property value 为从 value 获取名为 name 的属性的结果。如果这样做导致脚本运行且该脚本抛出错误，则返回错误，其错误码为 javascript error。
3. 令 cloned property result 为使用 session、 source property value 和 seen 调用 clone algorithm 的结果。
4. 如果 cloned property result 是成功，则用名称 name 和等于 cloned property result 的数据的值，设置 result 的属性。
5. 否则，返回 cloned property result。
移除 seen 的最后一个元素。
返回成功，其数据为 result。

当要求用参数 parameters 从请求中提取脚本参数时，实现必须：

令 script 为从 parameters 获取名为 "script" 的属性的结果。
如果 script 不是 String，则返回错误，其错误码为 invalid argument。
令 args 为从 parameters 获取名为 "args" 的属性的结果。
如果 args 不是 Array，则返回错误，其错误码为 invalid argument。
令 arguments 为使用 session 和 args JSON 反序列化的结果。
返回成功，其数据为 script 和 arguments。

执行函数体的规则如下。该算法返回一个 ECMAScript 完成记录。

如果在算法执行期间的任何时刻出现用户提示，则立即返回 Completion { [[Type]]: normal, [[Value]]: null, [[Target]]: empty }，但继续并行运行此算法的其他步骤。

令 window 为 session 的当前浏览上下文的活动文档的关联窗口。
令 environment settings 为 window 的相关设置对象。
令 global scope 为 environment settings realm 的全局环境。
如果 body 不能解析为 FunctionBody，或者解析检测到早期错误，则返回 Completion { [[Type]]: normal, [[Value]]: null, [[Target]]: empty }。
如果 body 以一个包含 use strict 指令的指令序言开头，则令 strict 为 true，否则令 strict 为 false。
使用 environment settings 准备运行脚本。
使用 environment settings 准备运行回调。
令 function 为调用 FunctionCreate 的结果，其参数为：

kind

Normal。

list

一个空List。

body

上面解析 body 的结果。

global scope

上面解析 global scope 的结果。

strict

上面解析 strict 的结果。
令 completion 为以 function 作为 this 值，调用 Function.[[Call]](window, parameters) 的结果。
使用 environment settings 运行回调后清理。
使用 environment settings 运行脚本后清理。
返回 completion。

注

上述算法不与任何特定元素关联，因此不受文档 CSP 指令约束。

HTTP 方法	URI 模板
POST	/session/{`session id`}/execute/sync

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 body 和 arguments 为使用参数 parameters trying 去从请求中提取脚本参数的结果。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 timeout 为 session 的会话超时的脚本超时。
令 timer 为一个新的计时器。
如果 timeout 不为 null：
1. 使用 timer 和 timeout 启动计时器。
令 promise 为一个新的 Promise。
并行运行以下子步骤：
1. 令 scriptPromise 为带参数 body 和 arguments promise 调用执行函数体的结果。
2. 当 scriptPromise 以值 v 兑现时，以值 v resolve promise。
3. 当 scriptPromise 以值 r 拒绝时，以值 r reject promise。
等待直到 promise 被解决，或 timer 的timeout fired flag 被设置，以先发生者为准。
如果 promise 仍处于待定状态，且 timer 的timeout fired flag 已设置，则返回错误，其错误码为 script timeout。
如果 promise 以值 v 兑现，则令 result 为使用 session 和 v 的JSON 克隆，并返回成功，其数据为 result。
如果 promise 以原因 r 被拒绝，则令 result 为使用 session 和 r 的JSON 克隆，并返回错误，其错误码为 javascript error，且数据为 result。

HTTP 方法	URI 模板
POST	/session/{`session id`}/execute/async

注

执行异步脚本命令会使 JavaScript 作为匿名函数执行。还会向该函数提供一个附加值作为最后一个参数。这是一个可被调用以表示异步操作完成的函数。提供给该函数的第一个参数会被序列化为 JSON，并由执行异步脚本返回。

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 body 和 arguments 为使用参数 parameters trying 去从请求中提取脚本参数的结果。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 timeout 为 session 的会话超时的脚本超时。
令 timer 为一个新的计时器。
如果 timeout 不为 null：
1. 使用 timer 和 timeout 启动计时器。
令 promise 为一个新的 Promise。
并行运行以下子步骤：
1. 令 resolvingFunctions 为 CreateResolvingFunctions(promise)。
2. 将 resolvingFunctions.[[Resolve]] 追加到 arguments。
3. 令 scriptResult 为用参数 body 和 arguments 调用执行函数体的结果。
4. 如果 scriptResult.[[Type]] 不是 normal，则以值 scriptResult.[[Value]] reject promise，并中止这些步骤。
  
  注
  
  本规范的先前修订没有识别所提供脚本的返回值。为了保留遗留行为，返回值只有在其为 "thenable" 对象，或判断这一点会产生异常时，才会影响命令。
5. 如果 Type(scriptResult.[[Value]]) 不是 Object，则中止这些步骤。
6. 令 then 为 Get(scriptResult.[[Value]], "then")。
7. 如果 then.[[Type]] 不是 normal，则以值 then.[[Value]] reject promise，并中止这些步骤。
8. 如果 IsCallable(then.[[Type]]) 为 false，则中止这些步骤。
9. 令 scriptPromise 为 PromiseResolve(Promise, scriptResult.[[Value]])。
10. 当 scriptPromise 以值 v 兑现时，以值 v resolve promise。
11. 当 scriptPromise 以值 r 拒绝时，以值 r reject promise。
等待直到 promise 被解决，或 timer 的timeout fired flag 被设置，以先发生者为准。
如果 promise 仍处于待定状态，且 timer 的timeout fired flag 已设置，则返回错误，其错误码为 script timeout。
如果 promise 以值 v 兑现，则令 result 为使用 session 和 v 的JSON 克隆，并返回成功，其数据为 result。
如果 promise 以原因 r 被拒绝，则令 result 为使用 session 和 r 的JSON 克隆，并返回错误，其错误码为 javascript error，且数据为 result。

本节描述与cookie 的交互，如 [RFC6265] 中所述。

[RFC6265] 将 cookie 描述为一个保存 cookie 数据的名称-值对，后跟零个或多个描述其特征的属性-值对。

以下cookie 转换表定义了与 WebDriver 相关的 cookie 概念、它们在 [RFC6265] 中如何称呼、它们映射到序列化 cookie中的哪些键，以及在构造创建 cookie所需参数列表时需要的属性-值键。

出于信息说明目的，该表包含一个图例，用于说明该字段在提供给添加 Cookie 的序列化 cookie中是否可选，并包含该字段的简要非规范性描述以及其关联值的预期输入类型。

概念	RFC 6265 字段	JSON 键	属性键	可选	描述
Cookie 名称	`name`	"`name`"			cookie 的名称。
Cookie 值	`value`	"`value`"			cookie 值。
Cookie 路径	`path`	"`path`"	"`Path`"	✓	cookie 路径。在添加 cookie时若省略，则默认为 "`/`"。
Cookie 域	`domain`	"`domain`"	"`Domain`"	✓	cookie 可见的域。在添加 cookie时若省略，则默认为 `session` 的当前浏览上下文的活动文档的 URL 的域。
Cookie secure only	`secure-only-flag`	"`secure`"	"`Secure`"	✓	cookie 是否为安全 cookie。在添加 cookie时若省略，则默认为 false。
Cookie HTTP only	`http-only-flag`	"`httpOnly`"	"`HttpOnly`"	✓	cookie 是否为 HTTP only cookie。在添加 cookie时若省略，则默认为 false。
Cookie 过期时间	`expiry-time`	"`expiry`"	"`Max-Age`"	✓	cookie 的过期时间，以自 Unix 纪元以来的秒数指定。在添加 cookie时若省略，则不得设置。
Cookie same site	`samesite`	"`sameSite`"	"`SameSite`"	✓	cookie 是否应用 SameSite 策略。在添加 cookie时若省略，则默认为 None。可设置为 `Lax` 或 `Strict`。

序列化 cookie是一个 JSON Object，其中cookie的 [RFC6265] 字段（列于cookie 转换表中）使用 JSON 键 和来自cookie 存储的相关字段值进行映射。可选字段可以省略。

为了获取与某个文档关联的所有 cookie，用户代理必须从给定文档的地址的 cookie 存储中，返回满足 [RFC6265] 中为 “HTTP API”计算 cookie-string 的算法第一步所列要求的cookie枚举集合。返回的 cookie 必须包括 HttpOnly cookie。

当远程端被指示创建 cookie时，这等同于执行 [RFC6265] 第 5.3 节中接收 cookie下描述的步骤，但用户代理不得完全忽略接收到的 cookie （忽略步骤 1）。

为了在给定可选过滤参数 name（其为字符串）时删除 cookie：

对于 session 的当前浏览上下文的活动文档的所有关联 cookie中的每个cookie，运行第一个匹配条件的子步骤：

name 是undefined

name 等于cookie 名称

将cookie 过期时间设置为过去的一个 Unix 时间戳。

否则

不执行任何操作。

HTTP 方法	URI 模板
GET	/session/{`session id`}/cookie

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 cookies 为一个新的List。
对于 session 的当前浏览上下文的活动文档的所有关联 cookie中的每个 cookie：
1. 令 serialized cookie 为序列化 cookie 的结果。
2. 将 serialized cookie 追加到 cookies
返回成功，其数据为 cookies。

HTTP 方法	URI 模板
GET	/session/{`session id`}/cookie/{`name`}

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
如果 URL variables["name" 等于 session 的当前浏览上下文的活动文档的所有关联 cookie中某个cookie的cookie 名称，则返回成功，其数据为该序列化 cookie。

否则，返回错误，其错误码为 no such cookie。

HTTP 方法	URI 模板
POST	/session/{`session id`}/cookie

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 data 为从 parameters 获取名为 "cookie" 的属性的结果。
如果 data 不是一个 JSON Object，且不具有cookie 转换表中列出的所有必需（非可选）JSON 键，则返回错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
如果cookie 名称或cookie 值为 null， cookie secure only 或cookie HTTP only 不是布尔类型，或cookie 过期时间不是整数类型，或其小于 0 或大于最大安全整数，则返回错误，其错误码为 invalid argument。
如果 session 的当前浏览上下文的文档元素是 cookie-averse Document 对象，或 cookie 域不等于 session 的当前浏览上下文的活动文档的域，则返回错误，其错误码为 invalid cookie domain。
在与活动文档的地址关联的 cookie 存储中，使用cookie 名称 name、 cookie 值 value，以及来自 data 的、cookie 转换表中列出的以下 cookie 概念的属性-值列表，创建 cookie：

Cookie 路径

如果条目存在则为该值，否则为 "/"。

Cookie 域

如果条目存在则为该值，否则为 session 的当前浏览上下文的活动文档的 URL 的域。

Cookie secure only

如果条目存在则为该值，否则为 false。

Cookie HTTP only

如果条目存在则为该值，否则为 false。

Cookie 过期时间

如果条目存在则为该值，否则保持未设置，以指示这是一个会话 cookie。

注

cookie 的过期值可能会由远程端根据 Cookie Lifetime Limits 进行限制。

Cookie same site

如果条目存在则为该值，否则保持未设置，以指示未定义 same site 策略。

如果在此步骤期间发生错误，则返回错误，其错误码为 unable to set cookie。
返回成功，其数据为null。

HTTP 方法	URI 模板
DELETE	/session/{`session id`}/cookie/{`name`}

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
使用 URL variables["name"] 作为过滤参数删除 cookie。
返回成功，其数据为null。

HTTP 方法	URI 模板
DELETE	/session/{`session id`}/cookie

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
删除 cookie，不提供过滤参数。
返回成功，其数据为null。

Actions API 提供了一个低级接口，用于向 Web 浏览器提供虚拟化设备输入。从概念上说，Actions 命令将时间划分为一系列tick。本地端发送一系列操作，这些操作对应于每个输入设备在每个tick期间状态的变化（如果有）。例如，按下一个键由一个操作序列表示，该序列由一个按键输入设备和两个tick组成，第一个包含一个 keyDown 操作，第二个包含一个 keyUp 操作；而捏合缩放输入则由一个操作序列表示，该序列由三个tick 和两个类型为 touch 的指针输入设备组成，每个设备都执行一系列操作：pointerDown，后跟 pointerMove，然后是 pointerUp。

示例 11

设想有两根手指在触摸屏上操作。一根手指将在 element1 上按下，同时另一根手指将在 element2 上按下。这些操作完成后，第一根手指将等待 5 秒，而另一根手指移动到 element3。然后两根手指都从触摸屏上释放。

当远程端接收到此内容时，它会查看每个输入源的操作列表。它会一起分派每个源的第一个操作，然后一起分派第二个操作，最后一起分派最终操作。

下面的图显示了每个操作何时执行。 "Source 1" 是第一根手指，而 "source 2" 是第二根手指。

输入源的数量没有限制，每个输入的操作列表长度也没有限制。这意味着，并不要求所有操作列表都具有相同长度。一个输入源的操作列表可能比另一个输入源包含更多操作。

在这种情况下，第一根手指的操作列表包含 2 个操作（pointerDown、pointerUp），第二根手指的操作列表包含 3 个（pointerDown、pointerMove、pointerUp）。

并且每个操作将按如下方式执行：

还可以表达操作的具体时序。 pause 操作可用于 (a) 指示某个输入源必须等待的具体时间量，或 (b) 用于表示当前输入源必须等待直到tick中的所有其他操作完成。对于前一种情况，正在执行的当前tick 必须等待最长的暂停完成。例如，在此图中：

远程端会在第一个tick中分派 pointerDown 操作。在第二个tick中，由于 source 1 声明了一个 5 秒的pause，远程端将为 source 2 分派 pointerUp 事件，并将在继续执行第三个tick之前等待 5 秒。

如果一个tick包含多个pause 持续时间，远程端会等待最大持续时间，然后继续执行下一个tick。

如前所述，pause 可用于表示某个tick期间的不活动。如果 pause 声明时没有时间段，则该输入源在包含它的 tick中不会执行任何操作。例如：

在tick 2 期间，source 1 将分派其 pointerMove 操作，而 source 2 将不执行任何操作。

操作分派的配置由一个操作选项对象控制。它是一个结构，具有名为是元素原点的字段，它是一组用于验证协议对象是否表示元素原点的步骤，以及获取元素原点，它是一组用于反序列化元素的步骤。

为了给定 session、origin 和 browsing context 来获取 WebElement 原点：,

断言：browsing context 是当前浏览上下文。
令 element 等于使用 session 和 origin trying 去获取已知元素的结果。
返回成功，其数据为 element。

输入源是一个提供输入事件的虚拟设备。每个输入源都由一个特定于该输入源类型的结构表示。每个输入源都有一个input id，它作为键存储在输入状态映射中。

为了给定 input state、type 和可选的 subtype 来创建输入源：

运行与 type 的第一个匹配值相匹配的子步骤：

"none"

令 source 为创建 null 输入源的结果。

"key"

令 source 为创建按键输入源的结果。

"pointer"

令 source 为用 input state 和 subtype 创建指针输入源的结果。

"wheel"

令 source 为创建滚轮输入源的结果。

否则：

返回错误，其错误码为 invalid argument。
返回成功，其数据为 source。

null 输入源是一个输入源，不与特定物理设备关联。null 输入源没有类型特定项，并支持以下操作：

操作	非规范性描述
pause	与整数参数一起使用，以指定一个tick的持续时间，或作为占位符，用于指示某个输入源在特定tick期间不执行任何操作。

为了创建 null 输入源，返回一个新的null 输入源。

按键输入源是一个输入源，与键盘类型设备关联。

按键输入源具有以下项：

项	非规范性描述	默认值
pressed	表示当前按下按键的字符串集合。	空集合
alt	一个布尔值，指示 alt 修饰键是否被按下。	False
ctrl	一个布尔值，指示 ctrl 修饰键是否被按下。	False
meta	一个布尔值，指示 meta 修饰键是否被按下。	False
shift	一个布尔值，指示 shift 修饰键是否被按下。	False

按键输入源支持与null 输入源相同的 pause 操作，以及以下操作：

操作	非规范性描述
keyDown	用于指示应按住某个特定按键。
keyUp	用于指示应释放一个已按下的按键。

为了创建按键输入源，返回一个新的按键输入源，并将各项初始化为其默认值。

指针输入源是一个输入源，与指针类型输入设备关联。

指针输入源具有以下项：

项	非规范性描述	默认值
subtype	指针设备的类型。可以是 "`mouse`"、 "`pen`" 或 "`touch`"。
pointerId	指针设备的数值 id。这是一个正整数，其中值 0 和 1 保留给 mouse 类型指针。
pressed	表示当前按下的指针按钮的无符号整数集合。	空集合
x	表示指针在视口坐标中 x 位置的无符号整数。	0
y	表示指针在视口坐标中 y 位置的无符号整数。	0

指针输入源支持与 null 输入源相同的 pause 操作，以及以下操作：

操作	非规范性描述
pointerDown	用于指示指针应以某种方式被按下，例如按住按钮（对于鼠标）或接触活动表面（对于触摸或笔设备）。
pointerUp	用于指示指针应以某种方式被释放，例如释放鼠标按钮，或将笔或触摸设备从活动表面移开。
pointerMove	用于指示屏幕上指针应移动到的位置，无论其处于活动（按下）还是非活动状态。
pointerCancel	用于取消指针操作。

为了在给定 input state 和 subtype 时创建指针输入源对象，返回一个新的指针输入源，其 subtype 设置为 subtype，pointerId 设置为使用 input state 和 subtype 获取指针 id的结果，并将其他项设置为其默认值。

滚轮输入源是一个输入源，与滚轮类型输入设备关联。滚轮输入源没有类型特定项，并支持与null 输入源相同的 pause 操作，以及以下操作：

操作	非规范性描述
scroll	用于指示滚轮向下、向上、向右或向左滚动，以使页面向下、向上、向右或向左滚动。

为了创建滚轮输入源，返回一个新的滚轮输入源。

输入状态表示一组输入源的整体状态。输入状态具有以下项：

输入状态映射，它是一个映射，其中键是 input id，值是输入源。
输入取消列表，它是操作对象的列表。该列表用于在重置输入源状态时管理事件分派
操作队列，它是一个队列，确保对输入状态的访问被串行化。

为了给定 session 和 browsing context 来获取输入状态：

断言：browsing context 是顶级浏览上下文。
令 input state map 为 session 的浏览上下文输入状态映射。
如果 input state map 不包含 browsing context，则将 input state map[browsing context] 设置为创建输入状态的结果。
返回 input state map[browsing context]。

为了给定 session 和 browsing context 来重置输入状态：

断言：browsing context 是顶级浏览上下文。
令 input state map 为 session 的浏览上下文输入状态映射。
如果 input state map[browsing context] 存在，则移除 input state map[browsing context]。

为了创建输入状态：

令 input state 为一个输入状态，其输入状态映射设置为空映射，且输入取消列表设置为空列表。
返回 input state。

为了给定 input state、 input id 和 source 来添加输入源：

令 input state map 为 input state 的输入状态映射。
将 input state map[input id] 设置为 source。

为了给定 input state 和 input id 来移除输入源：

断言：input state 的输入取消列表中的任何项都没有等于 input id 的 id。
令 input state map 为 input state 的输入状态映射。
移除 input state map[input id]。

为了给定 input state 和 input id 来获取输入源：

令 input state map 为 input state 的输入状态映射。
如果 input state map[input id] 存在，返回 input state map[input id]。
返回 undefined。

为了给定 input state、type、input id 和可选的 subtype 来获取或创建输入源：

令 source 为用 input state 和 input id 获取输入源的结果。
如果 source 不是 undefined 且 source 的 type 不等于 type，或者 source 是指针输入源，则返回错误，其错误码为 invalid argument。
如果 source 为 undefined，则将 source 设置为使用 input state 和 type trying 去创建输入源的结果。
返回成功，其数据为 source。

全局按键状态是一个结构，其项为 pressed、 altKey、ctrlKey、metaKey 和 shiftKey。

为了给定 input state 来获取全局按键状态：

令 input state map 为 input state 的输入状态映射。
令 sources 为使用 input state map 获取值的结果。
令 key state 为一个新的全局按键状态，其 pressed 设置为空集合， altKey、ctrlKey、metaKey 和 shiftKey 设置为 false。
对于 sources 中的每个 source：
1. 如果 source 不是按键输入源，则继续此循环的第一步。
2. 将 key state 的 pressed 项设置为其当前值与 source 的 pressed 项的并集。
3. 如果 source 的 alt 项为 true，则将 key state 的 altKey 项设置为 true。
4. 如果 source 的 ctrl 项为 true，则将 key state 的 ctrlKey 项设置为 true。
5. 如果 source 的 meta 项为 true，则将 key state 的 metaKey 项设置为 true。
6. 如果 source 的 shift 项为 true，则将 key state 的 shiftKey 项设置为 true。
返回 key state。

为了给定 input state 和 subtype 来获取指针 id：

如果 subtype 是 "mouse"，则令 minimum id 为 0，否则为 2。
令 pointer ids 为空集合。
令 sources 为使用 input state 的输入状态映射获取值的结果。
对于 sources 中的每个 source.：
1. 如果 source 是指针输入源，则将 source 的 pointerId 追加到 pointer ids。
返回大于或等于 minimum id 且未包含在 pointer ids 中的最小整数。

tick 是可以执行操作的基本时间单位。在一个tick期间，每个输入源都有一个被分配的操作——可能是一个 noop pause 操作——该操作可能导致用户代理内部状态发生变化，并最终导致 DOM 事件在页面上被触发。下一个tick会在用户代理有机会处理当前tick中生成的所有 DOM 事件之后开始。

异步等待是指在等待某事发生的同时，允许浏览器继续处理事件循环。

在最低层面，操作的行为旨在尽可能接近地模拟远程端使用真实输入设备时的行为，并且实现策略可能涉及例如将合成事件注入到浏览器事件循环中。因此，分派操作的步骤不可避免地会进入实现特定的领域。不过，仍有某些内容可观察效果必须在各实现之间保持一致。为了适应这一点，本规范要求远程端在浏览上下文 context 以及一个 list of events 及其属性上执行实现特定的操作分派步骤。这些步骤必须等价于在 context 上执行给定的输入设备操作，使得与 list of events 中各条目对应的受信任事件被分派。

注

WebDriver 生成的激活触发器需要与真实用户同浏览器交互所生成的触发器无法区分。特别是，所分派的事件将把 isTrusted 属性设置为 true。

分派这些事件最稳健的方式是在浏览器实现自身中创建它们。向浏览器窗口发送特定于操作系统的输入消息的缺点是，被自动化的浏览器可能无法与意外修改输入源的用户正确隔离。使用操作系统级辅助功能 API 的缺点是，浏览器窗口必须获得焦点，因此多个 WebDriver 实例无法并行运行。

操作系统级辅助功能 API 的优点是它保证输入能够正确反映用户输入，并在必要时允许与宿主系统交互。不过，从机器利用率角度看，这可能会带来性能损失。

从请求中提取操作序列的算法会接受表示操作序列的 JSON Object，验证输入，并返回一个作为输入 JSON 转置的数据结构，使得要在单个tick 中执行的操作会被分组在一起。

为了给定 source、x offset、y offset、 origin、browsing context 和 actions options 来获取相对于原点的坐标：

运行 origin 的第一个匹配值的子步骤：
"viewport"
1. 令 x 等于 x offset，令 y 等于 y offset。
"pointer"
1. 令 start x 等于 source 的 x 属性。
2. 令 start y 等于 source 的 y 属性。
3. 令 x 等于 start x + x offset，令 y 等于 start y + y offset。
否则
1. 令 element 为使用 origin 和 browsing context trying 去运行 actions options 的获取元素原点步骤的结果。
2. 如果 element 为 null，则返回错误，其错误码为 no such element。
3. 令 x element 和 y element 为计算 element 的视图内中心点的结果。
4. 令 x 等于 x element + x offset，并令 y 等于 y element + y offset。
返回 (x, y)

为了给定 input state、parameters 和 actions options 来提取操作序列：

令 actions 为从 parameters 中获取名为 "actions" 的属性的结果。
如果 actions 是 undefined 或不是 Array，则返回错误，其错误码为 invalid argument。
令 actions by tick 为空List。
对于 actions 中与索引属性对应的每个值 action sequence：
1. 令 source actions 为给定 input state、action sequence 和 actions options， trying 去处理输入源操作序列的结果。
2. 对于 source actions 中的每个 action：
  1. 令 i 为 action 在 source actions 中的从零开始的索引。
  2. 如果 actions by tick 的长度小于 i + 1，则向 actions by tick 追加一个新的List。
  3. 将 action 追加到 actions by tick 中索引为 i 的 List。
返回成功，其数据为 actions by tick。

当要求给定 input state、action sequence 和 actions options 处理输入源操作序列时，远程端必须：

令 type 为从 action sequence 获取名为 "type" 的属性的结果。
如果 type 不是 "key"、"pointer"、 "wheel" 或 "none"，则返回一个错误，其错误码为 invalid argument。
令 id 为从 action sequence 获取 "id" 属性的结果。
如果 id 是 undefined 或不是 String，则返回错误，其错误码为 invalid argument。
如果 type 等于 "pointer"，则令 parameters data 为从 action sequence 获取 "parameters" 属性的结果。然后令 parameters 为以 parameters data 作为参数 trying 去处理指针参数的结果。
令 source 为给定 input state、type 和 id trying to 获取或创建输入源的结果。
如果 parameters 不是 undefined，则如果其 pointerType 属性不等于 source 的 subtype 属性，返回一个错误，其错误码为 invalid argument。
令 action items 为从 action sequence 获取名为 "actions" 的属性的结果。
如果 action items 不是 Array，则返回错误，其错误码为 invalid argument。
令 actions 为一个新的列表。
对于 action items 中的每个 action item：
1. 如果 action item 不是Object，则返回错误，其错误码为 invalid argument。
2. 如果 type 是 "none"，则令 action 为以 id 和 action item 作为参数， trying 去处理 null 操作的结果。
3. 否则，如果 type 是 "key"，则令 action 为以 id 和 action item 作为参数， trying 去处理按键操作的结果。
4. 否则，如果 type 是 "pointer"，则令 action 为以 id、 parameters、action item 和 actions options 作为参数， trying 去处理指针操作的结果。
5. 否则，如果 type 是 "wheel"，则令 action 为以 id、 action item 和 actions options 作为参数， trying 去处理滚轮操作的结果。
6. 将 action 追加到 actions。
返回成功，其数据为 actions。

默认指针参数由一个对象组成，该对象的属性 pointerType 设置为 mouse。

为了给定 parameters data 来处理指针参数：

令 parameters 为默认指针参数。
如果 parameters data 是 undefined，则返回成功，其数据为 parameters。
如果 parameters data 不是Object，则返回错误，其错误码为 invalid argument。
令 pointer type 为从 parameters data 获取名为 "pointerType" 的属性的结果。
如果 pointer type 不是 undefined：
1. 如果 pointer type 不具有以下值之一： "mouse"、 "pen" 或 "touch"，则返回错误，其错误码为 invalid argument。
2. 将 parameters 的 pointerType 属性设置为 pointer type。
返回成功，其数据为 parameters。

使用参数 id、type 和 subtype 构造的操作对象是一个对象，其属性 id 设置为 id，type 设置为 type，subtype 设置为 subtype。具体的操作对象会由本规范中的其他算法添加更多属性。

为了给定 id 和 action item 来处理 null 操作：

令 subtype 为从 action item 获取名为 "type" 的属性的结果。
如果 subtype 不是 "pause"，则返回错误，其错误码为 invalid argument。
令 action 为一个使用参数 id、 "none" 和 subtype 构造的操作对象。
令 result 为以 action item 和 action 作为参数， trying 去处理 pause 操作的结果。
返回 result。

为了给定 id 和 action item 来处理按键操作：

令 subtype 为从 action item 获取名为 "type" 的属性的结果。
如果 subtype 不是以下值之一： "keyUp"、 "keyDown" 或 "pause"，则返回一个错误，其错误码为 invalid argument。
令 action 为一个使用参数 id、 "key" 和 subtype 构造的操作对象。
如果 subtype 是 "pause"，则令 result 为以 action item 和 action 作为参数 trying 去处理 pause 操作的结果，并返回 result。
令 key 为从 action item 获取名为 "value" 的属性的结果。
如果 key 不是一个包含单个unicode 码点的 String 还是字素簇？则返回错误，其错误码为 invalid argument。
将 action 上的 value 属性设置为 key。
返回成功，其数据为 action。

为了给定 id、 parameters、action item 和 action options 来处理指针操作：

令 subtype 为从 action item 获取名为 "type" 的属性的结果。
如果 subtype 不是以下值之一： "pause"、 "pointerUp"、 "pointerDown"、 "pointerMove" 或 "pointerCancel"，则返回一个错误，其错误码为 invalid argument。
令 action 为一个使用参数 id、 "pointer" 和 subtype 构造的操作对象。
如果 subtype 是 "pause"，则令 result 为以 action item、action 和 actions options 作为参数， trying 去处理 pause 操作的结果，并返回 result。
将 action 的 pointerType 属性设置为等于 parameters 的 pointerType 属性。
如果 subtype 是 "pointerUp" 或 "pointerDown"，则以 action item 和 action 作为参数处理 pointer up 或 pointer down 操作。如果这样做产生错误，则返回该错误。
如果 subtype 是 "pointerMove"，则以 action item、action 和 actions options 作为参数处理 pointer move 操作。如果这样做产生错误，则返回该错误。
如果 subtype 是 "pointerCancel"，处理 pointer cancel 操作。如果这样做产生错误，则返回该错误。
返回成功，其数据为 action。

为了给定 id、action item 和 actions options 来处理滚轮操作：

令 subtype 为从 action item 获取名为 "type" 的属性的结果。
如果 subtype 不是值 "pause" 或 "scroll"，则返回一个错误，其错误码为 invalid argument。
令 action 为一个使用参数 id、 "wheel" 和 subtype 构造的操作对象。
如果 subtype 是 "pause"，则令 result 为以 action item 和 action 作为参数， trying 去处理 pause 操作的结果，并返回 result。
令 duration 为从 action item 获取名为 "duration" 的属性的结果。
如果 duration 不是 undefined，且 duration 不是大于或等于 0 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 duration 属性设置为 duration。
令 origin 为从 action item 获取 origin 属性的结果。
如果 origin 是 undefined，则令 origin 等于 "viewport"。
如果 origin 不等于 "viewport"，或 actions options 的是元素原点步骤在给定 origin 时返回 false，则返回错误，其错误码为 invalid argument。
将 action 的 origin 属性设置为 origin。
令 x 为从 action item 获取 x 属性的结果。
如果 x 不是Integer，则返回错误，其错误码为 invalid argument。
将 action 的 x 属性设置为 x。
令 y 为从 action item 获取 y 属性的结果。
如果 y 不是Integer，则返回错误，其错误码为 invalid argument。
将 action 的 y 属性设置为 y。
令 deltaX 为从 action item 获取 deltaX 属性的结果。
如果 deltaX 不是Integer，则返回错误，其错误码为 invalid argument。
将 action 的 deltaX 属性设置为 deltaX。
令 deltaY 为从 action item 获取 deltaY 属性的结果。
如果 deltaY 不是Integer，则返回错误，其错误码为 invalid argument。
将 action 的 deltaY 属性设置为 deltaY。
返回成功，其数据为 action。

为了给定 action item 和 action 来处理 pause 操作：

令 duration 为从 action item 获取 "duration" 属性的结果。
如果 duration 不是 undefined 且 duration 不是大于或等于 0 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 duration 属性设置为 duration。
返回成功，其数据为 action。

为了给定 action item 和 action 处理 pointer up 或 pointer down 操作：

令 button 为从 action item 获取 button 属性的结果。
如果 button 不是大于或等于 0 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 button 属性设置为 button。
令 width 为从 action item 获取 width 属性的结果。
如果 width 不是 undefined 且 width 不是大于或等于 0 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 width 属性设置为 width。
令 height 为从 action item 获取 height 属性的结果。
如果 height 不是 undefined 且 height 不是大于或等于 0 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 height 属性设置为 height。
令 pressure 为从 action item 获取 pressure 属性的结果。
如果 pressure 不是 undefined 且 pressure 不是大于或等于 0 且小于或等于 1 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 pressure 属性设置为 pressure。
令 tangentialPressure 为从 action item 获取 tangentialPressure 属性的结果。
如果 tangentialPressure 不是 undefined 且 tangentialPressure 不是大于或等于 -1 且小于或等于 1 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 tangentialPressure 属性设置为 tangentialPressure。
令 tiltX 为从 action item 获取 tiltX 属性的结果。
如果 tiltX 不是 undefined 且 tiltX 不是大于或等于 -90 且小于或等于 90 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 tiltX 属性设置为 tiltX。
令 tiltY 为从 action item 获取 tiltY 属性的结果。
如果 tiltY 不是 undefined 且 tiltY 不是大于或等于 -90 且小于或等于 90 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 tiltY 属性设置为 tiltY。
令 twist 为从 action item 获取 twist 属性的结果。
如果 twist 不是 undefined 且 twist 不是大于或等于 0 且小于或等于 359 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 twist 属性设置为 twist。
令 altitudeAngle 为从 action item 获取 altitudeAngle 属性的结果。
如果 altitudeAngle 不是 undefined 且 altitudeAngle 不是大于或等于 0 且小于或等于 π/2 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 altitudeAngle 属性设置为 altitudeAngle。
令 azimuthAngle 为从 action item 获取 azimuthAngle 属性的结果。
如果 azimuthAngle 不是 undefined 且 azimuthAngle 不是大于或等于 0 且小于或等于 2π 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 azimuthAngle 属性设置为 azimuthAngle。
返回成功，其数据为 null。

为了给定 action item、action 和 actions options 来处理 pointer move 操作：

令 duration 为从 action item 获取 duration 属性的结果。
如果 duration 不是 undefined 且 duration 不是大于或等于 0 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 duration 属性设置为 duration。
令 origin 为从 action item 获取 origin 属性的结果。
如果 origin 是 undefined，则令 origin 等于 "viewport"。
如果 origin 不等于 "viewport" 或 "pointer"，且给定 origin 时， actions options 的是元素原点步骤返回 false，则返回错误，其错误码为 invalid argument。
将 action 的 origin 属性设置为 origin。
令 x 为从 action item 获取 x 属性的结果。
如果 x 不是Number，则返回错误，其错误码为 invalid argument。
将 action 的 x 属性设置为 x。
令 y 为从 action item 获取 y 属性的结果。
如果 y 不是Number，则返回错误，其错误码为 invalid argument。
将 action 的 y 属性设置为 y。
令 width 为从 action item 获取 width 属性的结果。
如果 width 不是 undefined 且 width 不是大于或等于 0 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 width 属性设置为 width。
令 height 为从 action item 获取 height 属性的结果。
如果 height 不是 undefined 且 height 不是大于或等于 0 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 height 属性设置为 height。
令 pressure 为从 action item 获取 pressure 属性的结果。
如果 pressure 不是 undefined 且 pressure 不是大于或等于 0 且小于或等于 1 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 pressure 属性设置为 pressure。
令 tangentialPressure 为从 action item 获取 tangentialPressure 属性的结果。
如果 tangentialPressure 不是 undefined 且 tangentialPressure 不是大于或等于 -1 且小于或等于 1 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 tangentialPressure 属性设置为 tangentialPressure。
令 tiltX 为从 action item 获取 tiltX 属性的结果。
如果 tiltX 不是 undefined 且 tiltX 不是大于或等于 -90 且小于或等于 90 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 tiltX 属性设置为 tiltX。
令 tiltY 为从 action item 获取 tiltY 属性的结果。
如果 tiltY 不是 undefined 且 tiltY 不是大于或等于 -90 且小于或等于 90 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 tiltY 属性设置为 tiltY。
令 twist 为从 action item 获取 twist 属性的结果。
如果 twist 不是 undefined 且 twist 不是大于或等于 0 且小于或等于 359 的Integer，则返回错误，其错误码为 invalid argument。
将 action 的 twist 属性设置为 twist。
令 altitudeAngle 为从 action item 获取 altitudeAngle 属性的结果。
如果 altitudeAngle 不是 undefined 且 altitudeAngle 不是大于或等于 0 且小于或等于 π/2 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 altitudeAngle 属性设置为 altitudeAngle。
令 azimuthAngle 为从 action item 获取 azimuthAngle 属性的结果。
如果 azimuthAngle 不是 undefined 且 azimuthAngle 不是大于或等于 0 且小于或等于 2π 的Number，则返回错误，其错误码为 invalid argument。
将 action 的 azimuthAngle 属性设置为 azimuthAngle。
返回成功，其数据为 null。

分派操作算法接受一个按 tick 分组的操作列表，然后使每个操作在序列中适当的点运行。

为了给定 input state 来等待操作队列令牌：

令 token 为一个新的唯一标识符。
将 token 入队到 input state 的操作队列。
等待 token 成为 input state 的操作队列中的第一项。

注

这确保同一时间只能运行一组操作，因而使用同一底层状态的不同 actions 命令不会产生竞争。在仅为 HTTP 会话的会话中，同一时间只能运行一个命令，因此这永远不会阻塞。但其他会话类型可能允许并行运行多个命令，在这种情况下这对于确保顺序访问是必要的。

为了给定 input state、actions by tick、browsing context 和 actions options 来分派操作：

使用 input state 等待操作队列令牌。
令 actions result 为使用 input state、actions by tick、browsing context 和 actions options 内部分派操作的结果。
从 input state 的操作队列出队。

断言：这会返回 token
返回 actions result。

为了给定 input state、actions by tick、browsing context 和 actions options 来内部分派操作：

对于 actions by tick 中的每个项 tick actions：
1. 如果 browsing context 不再打开，则返回错误，其错误码为 no such window。
2. 令 tick duration 为以 tick actions 为参数计算 tick 持续时间的结果。
3. Try 使用 input state、tick actions、tick duration、 browsing context 和 actions options 分派 tick 操作。
4. 等待直到以下条件全部满足：
  - 不存在由上一次调用分派 tick 操作步骤产生的待处理异步等待。
  - 用户代理事件循环已转动足够次数，以处理由上一次调用分派 tick 操作步骤生成的 DOM 事件。
  - 至少已经过 tick duration 毫秒。
返回成功，其数据为 null。

为了给定 tick actions 计算 tick 持续时间：

令 max duration 为 0。
对于 tick actions 中的每个 action object：
1. 令 duration 为 undefined。
2. 如果 action object 的 subtype 属性设置为 "pause"，或者 action object 的 type 属性设置为 "pointer" 且 subtype 属性设置为 "pointerMove"，或者 action object 的 type 属性设置为 "wheel" 且 subtype 属性设置为 "scroll"，则令 duration 等于 action object 的 duration 属性。
3. 如果 duration 不是 undefined，且 duration 大于 max duration，则令 max duration 等于 duration。
返回 max duration。

为了给定 input state、tick actions、tick duration、 browsing context 和 actions options 来分派 tick 操作：

对于 tick actions 中的每个 action object：

令 input id 等于 action object 的 id 属性的值。
令 source type 等于 action object 的 type 属性的值。
令 source 为给定 input state 和 input id 获取输入源的结果。
断言：source 不是 undefined。
令 global key state 为使用 input state 获取全局按键状态的结果。
令 subtype 为 action object 的 subtype。

令 algorithm 为下表中 source type 列为 source type 且 subtype 列等于 subtype 的行的 dispatch action algorithm 列的值。

source type	subtype	分派操作算法
"`none`"	"`pause`"	分派 pause 操作
"`key`"	"`pause`"	分派 pause 操作
"`key`"	"`keyDown`"	分派 keyDown 操作
"`key`"	"`keyUp`"	分派 keyUp 操作
"`pointer`"	"`pause`"	分派 pause 操作
"`pointer`"	"`pointerDown`"	分派 pointerDown 操作
"`pointer`"	"`pointerUp`"	分派 pointerUp 操作
"`pointer`"	"`pointerMove`"	分派 pointerMove 操作
"`pointer`"	"`pointerCancel`"	分派 pointerCancel 操作
"`wheel`"	"`pause`"	分派 pause 操作
"`wheel`"	"`scroll`"	分派 scroll 操作

Try 使用参数 action object、source、global key state、tick duration、browsing context 和 actions options 运行 algorithm。
如果 subtype 是 "keyDown"，则将 action object 的副本（其 subtype 属性改为 "keyUp"）追加到 input state 的输入取消列表。
如果 subtype 是 "pointerDown"，则将 action object 的副本（其 subtype 属性改为 "pointerUp"）追加到 input state 的输入取消列表。

返回成功，其数据为 null。

为了给定 input state、actions、browsing context 和 actions options 来分派操作列表：

注

令 tick actions 为列表 «actions»
令 actions by tick 为列表 «tick actions»。
返回使用 input state、actions by tick、browsing context 和 actions options 分派操作的结果。

为了给定 action object、source、global key state、tick duration、 browsing context 和 actions options 来分派 pause 操作：

返回成功，其数据为 null。

原始按键 key 的规范化按键值是：如果 key 出现在下表中，则为包含 key 的 unicode 码点的行中第二列的字符串值，否则为 key。

`key` 的码点	规范化按键值
`\uE000`	`"Unidentified"`
`\uE001`	`"Cancel"`
`\uE002`	`"Help"`
`\uE003`	`"Backspace"`
`\uE004`	`"Tab"`
`\uE005`	`"Clear"`
`\uE006`	`"Return"`
`\uE007`	`"Enter"`
`\uE008`	`"Shift"`
`\uE009`	`"Control"`
`\uE00A`	`"Alt"`
`\uE00B`	`"Pause"`
`\uE00C`	`"Escape"`
`\uE00D`	`" "`
`\uE00E`	`"PageUp"`
`\uE00F`	`"PageDown"`
`\uE010`	`"End"`
`\uE011`	`"Home"`
`\uE012`	`"ArrowLeft"`
`\uE013`	`"ArrowUp"`
`\uE014`	`"ArrowRight"`
`\uE015`	`"ArrowDown"`
`\uE016`	`"Insert"`
`\uE017`	`"Delete"`
`\uE018`	`";"`
`\uE019`	`"="`
`\uE01A`	`"0"`
`\uE01B`	`"1"`
`\uE01C`	`"2"`
`\uE01D`	`"3"`
`\uE01E`	`"4"`
`\uE01F`	`"5"`
`\uE020`	`"6"`
`\uE021`	`"7"`
`\uE022`	`"8"`
`\uE023`	`"9"`
`\uE024`	`"*"`
`\uE025`	`"+"`
`\uE026`	`","`
`\uE027`	`"-"`
`\uE028`	`"."`
`\uE029`	`"/"`
`\uE031`	`"F1"`
`\uE032`	`"F2"`
`\uE033`	`"F3"`
`\uE034`	`"F4"`
`\uE035`	`"F5"`
`\uE036`	`"F6"`
`\uE037`	`"F7"`
`\uE038`	`"F8"`
`\uE039`	`"F9"`
`\uE03A`	`"F10"`
`\uE03B`	`"F11"`
`\uE03C`	`"F12"`
`\uE03D`	`"Meta"`
`\uE040`	`"ZenkakuHankaku"`
`\uE050`	`"Shift"`
`\uE051`	`"Control"`
`\uE052`	`"Alt"`
`\uE053`	`"Meta"`
`\uE054`	`"PageUp"`
`\uE055`	`"PageDown"`
`\uE056`	`"End"`
`\uE057`	`"Home"`
`\uE058`	`"ArrowLeft"`
`\uE059`	`"ArrowUp"`
`\uE05A`	`"ArrowRight"`
`\uE05B`	`"ArrowDown"`
`\uE05C`	`"Insert"`
`\uE05D`	`"Delete"`

key 的code 是下表中第一列或第二列中包含 key 的行的最后一列中的值，如果存在这样的行；否则为 undefined。

shifted 字符是指出现在下表第二列中的字符。

Key	Alternate Key	code
"`"	`"~"`	`"Backquote"`
`"\"`	`"\|"`	`"Backslash"`
`"\uE003"`		`"Backspace"`
`"["`	`"{"`	`"BracketLeft"`
`"]"`	`"}"`	`"BracketRight"`
`","`	`"<"`	`"Comma"`
`"0"`	`")"`	`"Digit0"`
`"1"`	`"!"`	`"Digit1"`
`"2"`	`"@"`	`"Digit2"`
`"3"`	`"#"`	`"Digit3"`
`"4"`	`"$"`	`"Digit4"`
`"5"`	`"%"`	`"Digit5"`
`"6"`	`"^"`	`"Digit6"`
`"7"`	`"&"`	`"Digit7"`
`"8"`	`"*"`	`"Digit8"`
`"9"`	`"("`	`"Digit9"`
`"="`	`"+"`	`"Equal"`
`"<"`	`">"`	`"IntlBackslash"`
`"a"`	`"A"`	`"KeyA"`
`"b"`	`"B"`	`"KeyB"`
`"c"`	`"C"`	`"KeyC"`
`"d"`	`"D"`	`"KeyD"`
`"e"`	`"E"`	`"KeyE"`
`"f"`	`"F"`	`"KeyF"`
`"g"`	`"G"`	`"KeyG"`
`"h"`	`"H"`	`"KeyH"`
`"i"`	`"I"`	`"KeyI"`
`"j"`	`"J"`	`"KeyJ"`
`"k"`	`"K"`	`"KeyK"`
`"l"`	`"L"`	`"KeyL"`
`"m"`	`"M"`	`"KeyM"`
`"n"`	`"N"`	`"KeyN"`
`"o"`	`"O"`	`"KeyO"`
`"p"`	`"P"`	`"KeyP"`
`"q"`	`"Q"`	`"KeyQ"`
`"r"`	`"R"`	`"KeyR"`
`"s"`	`"S"`	`"KeyS"`
`"t"`	`"T"`	`"KeyT"`
`"u"`	`"U"`	`"KeyU"`
`"v"`	`"V"`	`"KeyV"`
`"w"`	`"W"`	`"KeyW"`
`"x"`	`"X"`	`"KeyX"`
`"y"`	`"Y"`	`"KeyY"`
`"z"`	`"Z"`	`"KeyZ"`
`"-"`	`"_"`	`"Minus"`
`"."`	`"."`	`"Period"`
`"'"`	`"""`	`"Quote"`
`";"`	`":"`	`"Semicolon"`
`"/"`	`"?"`	`"Slash"`
`"\uE00A"`		`"AltLeft"`
`"\uE052"`		`"AltRight"`
`"\uE009"`		`"ControlLeft"`
`"\uE051"`		`"ControlRight"`
`"\uE006"`		`"Enter"`
`"\uE00B"`		`"Pause"`
`"\uE03D"`		`"MetaLeft"`
`"\uE053"`		`"MetaRight"`
`"\uE008"`		`"ShiftLeft"`
`"\uE050"`		`"ShiftRight"`
`" "`	`"\uE00D"`	`"Space"`
`"\uE004"`		`"Tab"`
`"\uE017"`		`"Delete"`
`"\uE010"`		`"End"`
`"\uE002"`		`"Help"`
`"\uE011"`		`"Home"`
`"\uE016"`		`"Insert"`
`"\uE00F"`		`"PageDown"`
`"\uE00E"`		`"PageUp"`
`"\uE015"`		`"ArrowDown"`
`"\uE012"`		`"ArrowLeft"`
`"\uE014"`		`"ArrowRight"`
`"\uE013"`		`"ArrowUp"`
`"\uE00C"`		`"Escape"`
`"\uE031"`		`"F1"`
`"\uE032"`		`"F2"`
`"\uE033"`		`"F3"`
`"\uE034"`		`"F4"`
`"\uE035"`		`"F5"`
`"\uE036"`		`"F6"`
`"\uE037"`		`"F7"`
`"\uE038"`		`"F8"`
`"\uE039"`		`"F9"`
`"\uE03A"`		`"F10"`
`"\uE03B"`		`"F11"`
`"\uE03C"`		`"F12"`
`"\uE019"`		`"NumpadEqual"`
`"\uE01A"`	`"\uE05C"`	`"Numpad0"`
`"\uE01B"`	`"\uE056"`	`"Numpad1"`
`"\uE01C"`	`"\uE05B"`	`"Numpad2"`
`"\uE01D"`	`"\uE055"`	`"Numpad3"`
`"\uE01E"`	`"\uE058"`	`"Numpad4"`
`"\uE01F"`		`"Numpad5"`
`"\uE020"`	`"\uE05A"`	`"Numpad6"`
`"\uE021"`	`"\uE057"`	`"Numpad7"`
`"\uE022"`	`"\uE059"`	`"Numpad8"`
`"\uE023"`	`"\uE054"`	`"Numpad9"`
`"\uE025"`		`"NumpadAdd"`
`"\uE026"`		`"NumpadComma"`
`"\uE028"`	`"\uE05D"`	`"NumpadDecimal"`
`"\uE029"`		`"NumpadDivide"`
`"\uE007"`		`"NumpadEnter"`
`"\uE024"`		`"NumpadMultiply"`
`"\uE027"`		`"NumpadSubtract"`

The 按键位置 for key 是下表中第一列出现 key 的行的最后一列中的值，如果存在这样的行；否则为 0。

`key` 的码点	描述	位置
`\uE007`	Enter	`1`
`\uE008`	Left Shift	`1`
`\uE009`	Left Control	`1`
`\uE00A`	Left Alt	`1`
`\uE019`	Numpad =	`3`
`\uE01A`	Numpad 0	`3`
`\uE01B`	Numpad 1	`3`
`\uE01C`	Numpad 2	`3`
`\uE01D`	Numpad 3	`3`
`\uE01E`	Numpad 4	`3`
`\uE01F`	Numpad 5	`3`
`\uE020`	Numpad 6	`3`
`\uE021`	Numpad 7	`3`
`\uE022`	Numpad 8	`3`
`\uE023`	Numpad 9	`3`
`\uE024`	Numpad *	`3`
`\uE025`	Numpad +	`3`
`\uE026`	Numpad ,	`3`
`\uE027`	Numpad -	`3`
`\uE028`	Numpad .	`3`
`\uE029`	Numpad /	`3`
`\uE03D`	Left Meta	`1`
`\uE050`	Right Shift	`2`
`\uE051`	Right Control	`2`
`\uE052`	Right Alt	`2`
`\uE053`	Right Meta	`2`
`\uE054`	Numpad PageUp	`3`
`\uE055`	Numpad PageDown	`3`
`\uE056`	Numpad End	`3`
`\uE057`	Numpad Home	`3`
`\uE058`	Numpad ArrowLeft	`3`
`\uE059`	Numpad ArrowUp	`3`
`\uE05A`	Numpad ArrowRight	`3`
`\uE05B`	Numpad ArrowDown	`3`
`\uE05C`	Numpad Insert	`3`
`\uE05D`	Numpad Delete	`3`

为了给定 action object、source、global key state、tick duration、browsing context 和 actions options 来分派 keyDown 操作：

令 raw key 等于 action object 的 value 属性。
令 key 等于 raw key 的规范化按键值。
如果 source 的 pressed 属性包含 key，则令 repeat 为 true，否则令 repeat 为 false。
令 code 为 raw key 的code。
令 location 为 raw key 的按键位置。
令 charCode、keyCode 和 which 为 charCode、keyCode 和 which 属性的实现特定值，这些值适合 102 键美式键盘上具有 key key 和 location location 的按键，并遵循 [UI-EVENTS] 中的指导。
如果 key 是 "Alt"，则令 source 的 alt 属性为 true。
如果 key 是 "Shift"，则令 source 的 shift 属性为 true。
如果 key 是 "Control"，则令 source 的 ctrl 属性为 true。
如果 key 是 "Meta"，则令 source 的 meta 属性为 true。
将 key 添加到 source 的 pressed 属性。

在 browsing context 上执行实现特定的操作分派步骤，等价于按照 [UI-EVENTS] 的要求按下键盘上的一个键，并在适当时产生以下事件以及指定属性。这总会产生至少包含一个 keyDown 事件在内的事件。

keyDown 及其属性：

属性	值
`key`	`key`
`code`	`code`
`location`	`location`
`altKey`	`source` 的 `alt` 属性
`shiftKey`	`source` 的 `shift` 属性
`ctrlKey`	`source` 的 `ctrl` 属性
`metaKey`	`source` 的 `meta` 属性
`repeat`	`repeat`
`isComposing`	`false`
`charCode`	`charCode`
`keyCode`	`keyCode`
`which`	`which`

keyPress 及其属性：

属性	值
`key`	`key`
`code`	`code`
`location`	`location`
`altKey`	`source` 的 `alt` 属性
`shiftKey`	`source` 的 `shift` 属性
`ctrlKey`	`source` 的 `ctrl` 属性
`metaKey`	`source` 的 `meta` 属性
`repeat`	`repeat`
`isComposing`	`false`
`charCode`	`charCode`
`keyCode`	`keyCode`
`which`	`which`

返回成功，其数据为 null。

注

为了给定 action object、source、global key state、 tick duration、browsing context 和 actions options 来分派 keyUp 操作：

令 raw key 等于 action object 的 value 属性。
令 key 等于 raw key 的规范化按键值。
如果 source 的 pressed 项不包含 key，则返回。
令 code 为 raw key 的code。
令 location 为 raw key 的按键位置。
令 charCode、keyCode 和 which 为 charCode、keyCode 和 which 属性的实现特定值，这些值适合 102 键美式键盘上具有 key key 和 location location 的按键，并遵循 [UI-EVENTS] 中的指导。
如果 key 是 "Alt"，则令 source 的 alt 属性为 false。
如果 key 是 "Shift"，则令 source 的 shift 属性为 false。
如果 key 是 "Control"，则令 source 的 ctrl 属性为 false。
如果 key 是 "Meta"，则令 source 的 meta 属性为 false。
从 sources 的 pressed 属性中移除 key。

在 browsing context 上执行实现特定的操作分派步骤，等价于按照 [UI-EVENTS] 的要求释放键盘上的一个键，并产生至少以下事件以及指定属性：

keyup，及其属性：

属性	值
`key`	`key`
`code`	`code`
`location`	`location`
`altKey`	`source` 的 `altKey` 属性
`shiftKey`	`source` 的 `shift` 属性
`ctrlKey`	`source` 的 `ctrl` 属性
`metaKey`	`source` 的 `meta` 属性
`repeat`	`false`
`isComposing`	`false`
`charCode`	`charCode`
`keyCode`	`keyCode`
`which`	`which`

返回成功，其数据为 null。

为了给定 action object、source、global key state、tick duration、browsing context 和 actions options 来分派 pointerDown 操作：

令 pointerType 等于 action object 的 pointerType 属性。
令 button 等于 action object 的 button 属性。
如果 source 的 pressed 属性包含 button，则返回成功，其数据为 null。
令 x 等于 source 的 x 属性。
令 y 等于 source 的 y 属性。
将 button 添加到与 source 的 pressed 属性对应的集合中，并令 buttons 为该属性所得的值。
令 width 等于 action object 的 width 属性。
令 height 等于 action object 的 height 属性。
令 pressure 等于 action object 的 pressure 属性。
令 tangentialPressure 等于 action object 的 tangentialPressure 属性。
令 tiltX 等于 action object 的 tiltX 属性。
令 tiltY 等于 action object 的 tiltY 属性。
令 twist 等于 action object 的 twist 属性。
令 altitudeAngle 等于 action object 的 altitudeAngle 属性。
令 azimuthAngle 等于 action object 的 azimuthAngle 属性。
在 browsing context 上执行实现特定的操作分派步骤，等价于按下 pointerId 等于 source 的 pointerId、类型为 pointerType 的指针上编号为 button 的按钮，该指针位于视口 x 坐标 x、视口 y 坐标 y，具有 width、height、 pressure、tangentialPressure、tiltX、 tiltY、twist、altitudeAngle、 azimuthAngle，并按下 buttons 按钮，且符合 [UI-EVENTS] 和 [POINTER-EVENTS] 的要求。将 ctrlKey、 shiftKey、 altKey 和 metaKey 设置为 global key state 中对应项的值。未通过 webdriver API 暴露的指针类型特定属性必须设置为不支持该属性的硬件所指定的默认值。
返回成功，其数据为 null。

为了给定 action object、source、global key state、tick duration、browsing context 和 actions options 来分派 pointerUp 操作：

令 pointerType 等于 action object 的 pointerType 属性。
令 button 等于 action object 的 button 属性。
如果 source 的 pressed 属性不包含 button，则返回成功，其数据为 null。
令 x 等于 source 的 x 属性。
令 y 等于 source 的 y 属性。
从与 source 的 pressed 属性对应的集合中移除 button，并令 buttons 为该属性所得的值。
在 browsing context 上执行实现特定的操作分派步骤，等价于释放 pointerId 等于 input source 的 pointerId、类型为 pointerType 的指针上编号为 button 的按钮，该指针位于视口 x 坐标 x、视口 y 坐标 y，并按下 buttons 按钮，且符合 [UI-EVENTS] 和 [POINTER-EVENTS] 的要求。生成的事件必须将 ctrlKey、shiftKey、 altKey 和 metaKey 设置为 global key state 中对应项的值。未通过 webdriver API 暴露的指针类型特定属性必须设置为不支持该属性的硬件所指定的默认值。
返回成功，其数据为 null。

为了给定 action object、source、global key state、 tick duration、browsing context 和 actions options 来分派 pointerMove 操作：

令 x offset 等于 action object 的 x 属性。
令 y offset 等于 action object 的 y 属性。
令 origin 等于 action object 的 origin 属性。
令 (x, y) 为使用 source、x offset、y offset、 origin、browsing context 和 actions options trying 去获取相对于原点的坐标的结果。
如果 x 小于 0 或大于以 CSS 像素表示的视口宽度，则返回错误，其错误码为 move target out of bounds。
如果 y 小于 0 或大于以 CSS 像素表示的视口高度，则返回错误，其错误码为 move target out of bounds。
如果 action object 的 duration 属性不是 undefined，则令 duration 等于它；否则令 duration 等于 tick duration。
如果 duration 大于 0 且处于任何实现定义的边界内，则异步等待一段实现定义的时间经过。

该等待允许实现将整体指针移动建模为以实现定义的速率发生的一系列小移动（例如每次 vsync 一次移动）。
令 width 等于 action object 的 width 属性。
令 height 等于 action object 的 height 属性。
令 pressure 等于 action object 的 pressure 属性。
令 tangentialPressure 等于 action object 的 tangentialPressure 属性。
令 tiltX 等于 action object 的 tiltX 属性。
令 tiltY 等于 action object 的 tiltY 属性。
令 twist 等于 action object 的 twist 属性。
令 altitudeAngle 等于 action object 的 altitudeAngle 属性。
令 azimuthAngle 等于 action object 的 azimuthAngle 属性。
使用参数 source、global key state、duration、 start x、start y、x、y、 width、height、pressure、 tangentialPressure、tiltX、tiltY、 twist、altitudeAngle、azimuthAngle 执行 pointer move。
返回成功，其数据为 null。

为了给定 source、 global key state、duration、start x、 start y、target x、target y、width、 height、pressure、tangentialPressure、 tiltX、tiltY、twist、altitudeAngle 和 azimuthAngle 来执行 pointer move：

令 time delta 为自当前 tick 开始以来的时间，以单调时钟上的毫秒数度量。
如果 duration 大于 0，则令 duration ratio 为 time delta 与 duration 的比值；否则为 1。
如果 duration ratio 为 1，或者足够接近 1 以至于实现不会进一步细分 move 操作，则令 last 为 true。否则令 last 为 false。
如果 last 为 true，则令 x 等于 target x 且 y 等于 target y。

否则令 x 等于 duration ratio × (target x - start x) + start x 的近似值，并令 y 等于 duration ratio × (target y - start y) + start y 的近似值。
令 current x 等于 input state 的 x 属性。
令 current y 等于 input state 的 y 属性。
如果 x 不等于 current x 或 y 不等于 current y，则运行以下步骤：
1. 令 buttons 等于 input state 的 buttons 属性。
2. 在 browsing context 上执行实现特定的操作分派步骤，等价于移动 pointerId 等于 input source 的 pointerId、类型为 pointerType 的指针，从视口 x 坐标 current x、视口 y 坐标 current y 移动到视口 x 坐标 x 和视口 y 坐标 y，具有 width、height、 pressure、tangentialPressure、tiltX、 tiltY、twist、altitudeAngle、 azimuthAngle，并按下 buttons 按钮，且符合 [UI-EVENTS] 和 [POINTER-EVENTS] 的要求。生成的事件必须将 ctrlKey、shiftKey、 altKey 和 metaKey 设置为 global key state 中对应项的值。未通过 WebDriver API 暴露的指针类型特定属性必须设置为不支持该属性的硬件所指定的默认值。在 pointerType 为 "pen" 或 "touch" 且 buttons 为空的情况下，这可能是 no-op。对于类型为 "mouse" 的指针，这将始终产生至少包含一个 pointerMove 事件在内的事件。
3. 令 input state 的 x 属性等于 x，并令 y 属性等于 y。
如果 last 为 true，则返回。
并行运行以下子步骤：

注

该算法可能会触发分布在某段持续时间内的多个事件。为了管理这些事件相对于同一 tick 中其他操作所触发事件的调度，有意应用并行性。

初始指针移动会同步执行。这确保了 tick 中每个操作所触发的第一个事件序列具有确定性。

后续移动（若有）会异步执行。这允许 tick 中两个 pointerMove 操作产生的事件相互交错。
1. 异步等待一段实现定义的时间经过。
  
  该等待允许实现将整体指针移动建模为以实现定义的速率发生的一系列小移动（例如每次 vsync 一次移动）。
2. 使用参数 input state、duration、 start x、start y、target x、 target y 执行 pointer move。

为了给定 action object、source、global key state、 tick duration、browsing context 和 actions options 来分派 pointerCancel 操作：

在 browsing context 上执行实现特定的操作分派步骤，等价于取消 pointerId 等于 source 的 pointerId 项、类型为 pointerType 的指针的任何操作，且符合 [UI-EVENTS] 和 [POINTER-EVENTS] 的要求。
返回成功，其数据为 null。

为了给定 action object、source、global key state、 tick duration、browsing context 和 actions options 来分派 scroll 操作：

令 x offset 等于 action object 的 x 属性。
令 y offset 等于 action object 的 y 属性。
令 origin 等于 action object 的 origin 属性。
令 (x, y) 为使用 source、x offset、y offset、 origin、browsing context 和 actions options trying 去获取相对于原点的坐标的结果。
如果 x 小于 0 或大于以 CSS 像素表示的视口宽度，则返回错误，其错误码为 move target out of bounds。
如果 y 小于 0 或大于以 CSS 像素表示的视口高度，则返回错误，其错误码为 move target out of bounds。
令 delta x 等于 action object 的 deltaX 属性。
令 delta y 等于 action object 的 deltaY 属性。
如果 action object 的 duration 属性不是 undefined，则令 duration 等于它；否则令 duration 等于 tick duration。
如果 duration 大于 0 且处于任何实现定义的边界内，则异步等待一段实现定义的时间经过。

该等待允许实现将整体滚轮滚动建模为以实现定义的速率发生的一系列小滚动（例如每次 vsync 一次滚动）。
使用参数 global key state、duration、 x、y、delta x、delta y、 0、0 执行 scroll。
返回成功，其数据为 null。

为了给定 duration、x、y、 target delta x、target delta y、 current delta x 和 current delta y 来执行 scroll：

令 time delta 为自当前 tick 开始以来的时间，以单调时钟上的毫秒数度量。
如果 duration 大于 0，则令 duration ratio 为 time delta 与 duration 的比值；否则为 1。
如果 duration ratio 为 1，或者足够接近 1 以至于实现不会进一步细分 move 操作，则令 last 为 true。否则令 last 为 false。
如果 last 为 true，则令 delta x 等于 target delta x - current delta x，并令 delta y 等于 target delta y - current delta y。

否则令 delta x 等于 duration ratio × target delta x - current delta x 的近似值，并令 delta y 等于 duration ratio × target delta y - current delta y 的近似值。
如果 delta x 不等于 0 或 delta y 不等于 0，则运行以下步骤：
1. 在 browsing context 上执行实现特定的操作分派步骤，等价于在视口 x 坐标 x、视口 y 坐标 y 处进行滚轮滚动，deltaX 值为 delta x，deltaY 值为 delta y，且符合 [UI-EVENTS] 的要求。生成的事件必须将 ctrlKey、shiftKey、 altKey 和 metaKey 设置为 global key state 中对应项的值。
2. 令 current delta x 属性等于 delta x + current delta x，并令 current delta y 属性等于 delta y + current delta y。
如果 last 为 true，则返回。
并行运行以下子步骤：

注

该算法可能会触发分布在某段持续时间内的多个事件。为了管理这些事件相对于同一 tick 中其他操作所触发事件的调度，有意应用并行性。

初始滚动会同步执行。这确保了 tick 中每个操作所触发的第一个事件序列具有确定性。

后续滚动（若有）会异步执行。这允许 tick 中两个 scroll 操作产生的事件相互交错。
1. 异步等待一段实现定义的时间经过。
  
  该等待允许实现将整体滚动建模为以实现定义的速率发生的一系列小滚动（例如每次 vsync 一次滚动）。
2. 使用参数 duration、x、y、 target delta x、target delta y、 current delta x、current delta y 执行 scroll。

HTTP 方法	URI 模板
POST	/session/{`session id`}/actions

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 input state 为使用 session 和 session 的当前顶级浏览上下文获取输入状态的结果。
令 actions options 为一个新的操作选项，其是元素原点步骤设置为表示 web 元素，且获取元素原点步骤设置为获取 WebElement 原点。
令 actions by tick 为使用 input state、parameters 和 actions options trying 去提取操作序列的结果。
使用 input state、 actions by tick、当前浏览上下文和 actions options 分派操作。如果这产生错误，则返回该错误。
返回成功，其数据为 null。

HTTP 方法	URI 模板
DELETE	/session/{`session id`}/actions

注

释放操作命令用于释放当前被按下的所有按键和指针按钮。这会使事件被触发，就好像该状态是通过一系列显式操作释放的一样。它还会清除虚拟设备的所有内部状态。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 input state 为使用session 和当前顶级浏览上下文获取输入状态的结果。
令 actions options 为一个新的操作选项，其是元素原点步骤设置为表示 web 元素，且获取元素原点步骤设置为获取 WebElement 原点。
使用 input state 等待操作队列令牌。
令 undo actions 为 input state 的输入取消列表的逆序。
Try 使用 input state、 undo actions、当前浏览上下文和 actions options 分派操作。
使用 session 和 session 的当前顶级浏览上下文重置输入状态。
返回成功，其数据为 null。

本章描述与各种类型的用户提示的交互。用户提示的共同点是：它们都是模态窗口，需要用户先与其交互，事件循环才会取消暂停，并将控制权返回给 session 的当前顶级浏览上下文。

默认情况下，用户提示不会被自动处理，除非定义了用户提示处理程序。当用户提示出现时，后续命令负责处理它。如果后续请求的命令不是本章列出的命令之一，则会返回 unexpected alert open 错误。

只要活动会话是一个只包含一个项的列表，并且该项是 HTTP 会话，但不是 BiDi 会话，则在触发 beforeunload 的步骤中，实现必须表现得好像显示 unload 提示很可能会令人厌烦、具有欺骗性或没有意义。

注

这意味着当存在活动的仅 HTTP 会话时， beforeunload 提示永远不会显示。

用户提示有关联的用户提示消息，它是显示给用户的字符串消息；如果消息长度为 0，则为 null。

为了给定 browsing context: 来获取活动用户提示

令 agent 为browsing context 的活动文档的相关代理。
如果 agent 的事件循环当前未暂停，则返回 null。
返回用于处理满足 event loop 被暂停时传入条件所需输入的用户提示。

当前用户提示是以当前浏览上下文获取活动用户提示的结果。

要dismiss 一个用户提示，则表现得好像用户点击了该提示上的 Cancel 按钮；如果不存在该按钮，则改为accept 该提示。

要accept 一个用户提示，则表现得好像用户点击了该提示上的 OK 按钮。

远程端具有一个用户提示处理程序，它定义当用户提示被显示时 WebDriver 会话将如何响应。它要么为 null，要么为字符串和提示处理程序配置值之间的映射。初始时它为 null。

提示处理程序配置是一个有两个项的结构体；一个是 handler，它是一个字符串；另一个是 notify，它是一个布尔值。

为了给定 configuration 来序列化提示处理程序配置：

令 serialized 为 configuration 的handler。
如果 «"dismiss", "accept"» 包含 serialized，且 configuration 的notify 为 true，则将 " and notify" 追加到 serialized。
返回 serialized。

已知提示处理程序为：

Handler key	描述（非规范性）。
"`dismiss`"	遇到的所有简单对话框都应被dismissed。
"`accept`"	遇到的所有简单对话框都应被accepted。
"`dismiss and notify`"	遇到的所有简单对话框都应被dismissed，并返回一个错误以表明该对话框已被处理。
"`accept and notify`"	遇到的所有简单对话框都应被accepted，并返回一个错误以表明该对话框已被处理。
"`ignore`"	遇到的所有简单对话框都应留给用户处理。

有效提示类型为 «"alert", "beforeUnload", "confirm", "default", "file", "prompt"»。

注

"default" 类型表示当没有为给定提示类型定义特定处理程序时的后备，包括 "beforeUnload" 提示类型。只有在 unhandled prompt behavior 是一个映射并且包含 "default" 时，才能设置它。对于将 unhandled prompt behavior 设置为字符串值的仅 HTTP 会话，该值会被赋给内部类型 "fallbackDefault"。 "fallbackDefault" 值不会用于 "beforeUnload" 提示类型，而是回退到 "accept" 处理程序。这是因为仅 HTTP 会话不允许自定义 "beforeUnload" 处理程序，并且启用其他协议不应作为副作用改变用户提示处理。

注

"file" 提示类型只在 [WebDriver-BiDi] 会话中被尊重。

为了给定参数 value 来反序列化为 unhandled prompt behavior：

将 value 设置为使用 value 将 JSON 派生的 JavaScript 值转换为 Infra 值的结果。
如果 value 不是字符串，则不同时支持 [WebDriver-BiDi] 的实现可以返回错误，其错误码为 invalid argument。

注

这是为了避免 [WebDriver-BiDi] monkey-patching 当前规范。
令 is string value 为 false。
如果 value 是字符串，则将 value 设置为映射 «["fallbackDefault" → value]»，并将 is string value 设置为 true。
如果 value 不是映射，则返回错误，其错误码为 invalid argument。
令 user prompt handler 为空映射。
对于 value 中的每个 prompt type → handler：
1. 如果 is string value 为 false，且有效提示类型不包含 prompt type，则返回错误，其错误码为 invalid argument。
2. 如果已知提示处理程序不包含 handler key 为 handler 的条目，则返回错误，其错误码为 invalid argument。
3. 令 notify 为 false。
4. 如果 handler 是 "accept and notify"，则将 handler 设置为 "accept" 并将 notify 设置为 true。
5. 如果 handler 是 "dismiss and notify"，则将 handler 设置为 "dismiss" 并将 notify 设置为 true。
6. 如果 handler 是 "ignore"，则将 notify 设置为 true。
7. 令 configuration 为一个提示处理程序配置，其handler 为 handler，notify 为 notify。
8. 设置 user prompt handler[prompt type] 为 configuration。
返回成功，其数据为 user prompt handler。

为了给定 requested prompt handler 来检查用户提示处理程序匹配：

如果用户提示处理程序为 null，则返回 true。
对于 requested prompt handler 中的每个 request prompt type → request handler：
1. 如果用户提示处理程序包含 request prompt type：
  1. 如果 requested prompt handler 的handler 不等于用户提示处理程序的handler，则返回 false。
返回 true

注

这不会检查 requested prompt handler 的notify 是否与 handler 匹配，因为 notify 组件只会影响HTTP 会话（如果有）。

为了给定 requested prompt handler 来更新用户提示处理程序：

如果用户提示处理程序为 null，则将用户提示处理程序设置为空映射。
对于 requested prompt handler 中的每个 request prompt type → request handler：
1. 将user prompt handler[request prompt type] 设置为 request handler。

要序列化用户提示处理程序：

如果用户提示处理程序为 null，则返回 "dismiss and notify"。
如果用户提示处理程序的大小为 1，且用户提示处理程序包含 "fallbackDefault"，则返回以 user prompt handler["fallbackDefault"] 调用序列化提示处理程序配置的结果。
令 serialized 为空映射。
对于用户提示处理程序中的每个 key → value：
1. 将 serialized[key] 设置为以 value 调用序列化提示处理程序配置的结果。
返回以 serialized 调用将 Infra 值转换为 JSON 兼容的 JavaScript 值的结果。

带注解的 unexpected alert open 错误是一个错误，其错误码为 unexpected alert open，并且带有可选的错误数据字典，其具有以下条目：

"text": 当前用户提示的消息。

为了获取 type 的提示处理程序：

如果用户提示处理程序为 null，则令 handlers 为空映射。否则令 handlers 为用户提示处理程序。
如果 handlers 包含 type，则返回 handlers[type]。
如果 handlers 包含 "default"，则返回 handlers["default"]。
如果 type 是 "beforeUnload"，则返回一个提示处理程序配置，其handler 为 "accept"， notify 为 false。
如果 handlers 包含 "fallbackDefault"，则返回 handlers["fallbackDefault"]。
返回一个提示处理程序配置，其handler 为 "dismiss"，notify 为 true。

要处理任何用户提示：

如果当前浏览上下文未被对话框阻塞，则返回成功。
令 type 为 "default"。
如果当前用户提示是 alert 对话框，则将 type 设置为 "alert"。否则，如果当前用户提示是 beforeunload 对话框，则将 type 设置为 "beforeUnload"。否则，如果当前用户提示是 confirm 对话框，则将 type 设置为 "confirm"。否则，如果当前用户提示是 prompt 对话框，则将 type 设置为 "prompt"。
令 handler 为以 type 调用获取提示处理程序的结果。
根据 handler 的handler 执行以下子步骤：

"accept"

Accept 当前用户提示。

"dismiss"

Dismiss 当前用户提示。

"ignore"

不执行任何操作。
如果 handler 的notify 为 true，则返回带注解的 unexpected alert open 错误。
返回成功。

示例 12

当返回带有 unexpected alert open 的错误时，远程端可以选择将用户提示消息作为错误表示上附加的 "data" Object 的一部分返回：


{
	"error": "unexpected alert open",
	"message": "implementation defined",
	"stacktrace": "",
	"data": {
		"text": "the text from the alert"
	}
}

HTTP 方法	URI 模板
POST	/session/{`session id`}/alert/dismiss

注

Dismiss Alert 命令会在存在简单对话框时 dismisses 它。对 alert 用户提示的 dismiss 请求，其不一定具有 dismiss 按钮，与accepting 它具有相同效果。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
如果当前用户提示为 null，则返回错误，其错误码为 no such alert。
Dismiss 当前用户提示。
返回成功，其数据为 null。

HTTP 方法	URI 模板
POST	/session/{`session id`}/alert/accept

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
如果当前用户提示为 null，则返回错误，其错误码为 no such alert。
Accept 当前用户提示。
返回成功，其数据为 null。

HTTP 方法	URI 模板
GET	/session/{`session id`}/alert/text

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
如果当前用户提示为 null，则返回错误，其错误码为 no such alert。
令 message 为与当前用户提示关联的文本消息；否则为 null。
返回成功，其数据为 message。

HTTP 方法	URI 模板
POST	/session/{`session id`}/alert/text

注

发送 Alert 文本命令将 window.prompt 用户提示的文本字段设置为给定值。

给定 session、URL variables 和 parameters 时，远程端步骤为：

令 text 为从 parameters 获取属性 "text" 的结果。
如果 text 不是String，则返回错误，其错误码为 invalid argument。
如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
如果当前用户提示为 null，则返回错误，其错误码为 no such alert。
运行创建当前用户提示的 API 的子步骤：

window.alert

window.confirm

返回错误，其错误码为 element not interactable。

window.prompt

不执行任何操作。

否则

返回错误，其错误码为 unsupported operation。
执行依赖用户代理的步骤，将当前用户提示的文本字段的值设置为 text。
返回成功，其数据为 null。

屏幕截图是一种用于提供附加可视诊断信息的机制。它们的工作方式是将可视视口的 framebuffer 的快照转储为无损 PNG 图像。它会作为 Base64 编码字符串返回给本地端。

WebDriver 提供 Take Screenshot 命令来捕获顶级浏览上下文的可视视口，并提供一个命令 Take Element Screenshot，用于在一个元素已滚动到视图中后，对其边界矩形的可见区域执行相同操作。

为了在给定一个矩形时，从 framebuffer 绘制边界框：

如果可视视口的宽度或高度任一为 0 CSS 像素，则返回错误，其错误码为 unable to capture screen。
令 paint width 为可视视口的宽度 – min(rectangle x 坐标, rectangle x 坐标 + rectangle 宽度尺寸)。
令 paint height 为可视视口的高度 – min(rectangle y 坐标, rectangle y 坐标 + rectangle 高度尺寸)。
令 canvas 为一个新的 canvas 元素，并将其 width 和 height 分别设置为 paint width 和 paint height。
令 context（一个canvas context mode）为以 canvas 作为目标调用 2D context creation algorithm 的结果。
完成实现特定的步骤，等价于将由以下坐标指定的 framebuffer 区域绘制到 context 上：

X 坐标

rectangle x 坐标

Y 坐标

rectangle y 坐标

宽度

paint width

高度

paint height
返回成功，其数据为 canvas。

要将 canvas 元素编码为 Base64：

如果 canvas 元素的位图的 origin-clean 标志被设置为 false，则返回错误，其错误码为 unable to capture screen。
如果 canvas 元素的位图没有像素（即其水平尺寸或垂直尺寸任一为零），则返回错误，其错误码为 unable to capture screen。
令 file 为将 canvas 元素的位图序列化为文件的结果，并使用 "image/png" 作为参数。
令 data URL 为表示 file 的 data: URL。 [RFC2397]
令 index 为 data URL 中 "," 的索引。
令 encoded string 为 data URL 的一个子字符串，其中使用 (index + 1) 作为 start 参数。
返回成功，其数据为 encoded string。

HTTP 方法	URI 模板
GET	/session/{`session id`}/screenshot

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
当用户代理下一次将要运行动画帧回调时：
1. 令 root rect 为 session 的当前顶级浏览上下文的文档元素的矩形。
2. 令 screenshot result 为以 root rect 作为参数，trying 调用从 framebuffer 绘制边界框的结果。
3. 令 canvas 为 screenshot result 的 data 的 canvas 元素。
4. 令 encoding result 为trying 以 canvas 调用将 canvas 编码为 Base64 的结果。
5. 令 encoded string 为 encoding result 的 data。
返回成功，其数据为 encoded string。

HTTP 方法	URI 模板
GET	/session/{`session id`}/element/{`element id`}/screenshot

注

Take Element Screenshot 命令会截取由一个元素的边界矩形所包含的可见区域的屏幕截图。

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 element 为使用 session 和 URL variables["element id"] trying 去获取已知元素的结果。
将 element 滚动到视图中。
当用户代理下一次将要运行动画帧回调时：
1. 令 element rect 为 element 的矩形。
2. 令 screenshot result 为以 element rect 作为参数 trying 调用从 framebuffer 绘制边界框的结果。
3. 令 canvas 为 screenshot result 的 data 的 canvas 元素。
4. 令 encoding result 为trying 以 canvas 调用将 canvas 编码为 Base64 的结果。
5. 令 encoded string 为 encoding result 的 data。
返回成功，其数据为 encoded string。

打印功能是一种将文档渲染为分页格式的机制。它会作为包含分页文档 PDF 表示的 Base64 编码字符串返回给本地端。

当要求以参数 pageRanges 和 totalPages 解析页面范围时，实现必须：

令 pages 为空集合
对于 pageRanges 中的每个 range，运行以下步骤：
1. 如果 range 既不是Number 也不是 String，则返回错误，其错误码为 invalid argument。
2. 如果 range 是Number：
  1. 如果 range 不是整数或小于 0，则返回错误，其错误码为 invalid argument
  2. 将 range 追加到 pages
  否则：
  1. 令 rangeParts 为在 "-" 字符上拆分 range 的结果。
  2. 如果 rangeParts 少于 1 个或多于 2 个元素，则返回错误，其错误码为 invalid argument。
  3. 如果 rangeParts 有一个元素，则将对 rangeParts 的第一个元素 trying 去解析为整数的结果追加到 pages。
    否则：
    1. 如果 rangeParts 的第一个元素等价于空字符串，则令 lowerBound 为 1。否则令 lowerBound 为对 rangeParts 的第一个元素 trying 去解析为整数的结果。
    2. 如果 rangeParts 的第二个元素等价于空字符串则令 upperBound 为 totalPages。否则令 upperBound 为对 rangeParts 的第二个元素 trying 去解析为整数的结果。
    3. 如果 lowerBound 大于 upperBound，则返回错误，其错误码为 invalid argument。
    4. 将从 lowerBound 到 upperBound 的闭区间中的所有整数追加到 pages
3. 返回成功，其数据为 pages。

如果一个String 在移除所有空白字符后长度为零，则它等价于空字符串。

当要求以参数 input 解析为整数时，实现必须：

令 stripped 为从 input 中剥离所有前导和尾随空白字符的结果。
如果 stripped 长度为零，则返回错误，其状态为 invalid argument。
如果 stripped 包含范围 U+0030 - U+0039（即 0 - 9）之外的任何字符，则返回错误，其状态为 invalid argument。
令 output 为以字符串 stripped 和基数 10 调用 parseInt 的结果。
返回成功，其数据为 output。

HTTP 方法	URI 模板
POST	/session/{`session id`}/print

给定 session、URL variables 和 parameters 时，远程端步骤为：

如果 session 的当前顶级浏览上下文不再打开，则返回错误，其错误码为 no such window。
Try 使用 session 处理任何用户提示。
令 orientation 为从 parameters 获取带默认值的属性，该属性名为 "orientation"，默认值为 "portrait" 的结果。
如果 orientation 不是String，或者不是 "landscape" 或 "portrait" 这两个值之一，则返回错误，其错误码为 invalid argument。
令 scale 为从 parameters 获取带默认值的属性，该属性名为 "scale"，默认值为 1 的结果。
如果 scale 不是Number，或者小于 0.1 或大于 2，则返回错误，其错误码为 invalid argument。
令 background 为从 parameters 获取带默认值的属性，该属性名为 "background"，默认值为 false 的结果。
如果 background 不是Boolean，则返回错误，其错误码为 invalid argument。
令 page 为从 parameters 获取带默认值的属性，该属性名为 "page"，默认值为一个空Object 的结果。
令 pageWidth 为从 page 获取带默认值的属性，该属性名为 "width"，默认值为 21.59 的结果。
令 pageHeight 为从 page 获取带默认值的属性，该属性名为 "height"，默认值为 27.94 的结果。
如果 pageWidth 或 pageHeight 任一不是Number，或者小于 (2.54 / 72)，则返回错误，其错误码为 invalid argument。

注

最小页面大小为 1 point，按照绝对长度即为 (2.54 / 72)。
令 margin 为从 parameters 获取带默认值的属性，该属性名为 "margin"，默认值为一个空Object 的结果。
令 marginTop 为从 margin 获取带默认值的属性，该属性名为 "top"，默认值为 1 的结果。
令 marginBottom 为从 margin 获取带默认值的属性，该属性名为 "bottom"，默认值为 1 的结果。
令 marginLeft 为从 margin 获取带默认值的属性，该属性名为 "left"，默认值为 1 的结果。
令 marginRight 为从 margin 获取带默认值的属性，该属性名为 "right"，默认值为 1 的结果。
如果 marginTop、marginBottom、marginLeft 或 marginRight 中任何一个不是Number，或者小于 0，则返回错误，其错误码为 invalid argument。
令 shrinkToFit 为从 parameters 获取带默认值的属性，该属性名为 "shrinkToFit"，默认值为 true 的结果。
如果 shrinkToFit 不是Boolean，则返回错误，其错误码为 invalid argument。
令 pageRanges 为从 parameters 获取带默认值的属性，该属性名为 "pageRanges"，默认值为一个空Array 的结果。
如果 pageRanges 不是Array，则返回错误，其错误码为 invalid argument。

当用户代理下一次将要运行动画帧回调时，令 pdfData 为trying 执行 UA 特定步骤来生成 session 的当前浏览上下文的分页表示的结果，其中 CSS 媒体类型设置为 print，编码为 PDF，并带有以下纸张设置：

属性	值
宽度，单位 cm	如果 `orientation` 为 "`portrait`"，则为 `pageWidth`，否则为 `pageHeight`
高度，单位 cm	如果 `orientation` 为 "`portrait`"，则为 `pageHeight`，否则为 `pageWidth`
上边距，单位 cm	`marginTop`
下边距，单位 cm	`marginBottom`
左边距，单位 cm	`marginLeft`
右边距，单位 cm	`marginRight`

此外，UA 应应用以下格式化提示：

如果 scale 不等于 1: 按因子 scale 缩放内容大小
如果 background 为 false: 抑制背景图像输出
如果 shrinkToFit 为 true: 调整内容大小以匹配页面宽度，覆盖内容中指定的任何页面宽度

如果 pageRanges 不是空Array，令 pages 为使用参数 pageRanges 以及 pdfData 中包含的页数 trying 去解析页面范围的结果，然后从 pdfData 中移除一基索引不包含在 pages 中的任何页面
令 encoding result 为在 pdfData 上调用 Base64 Encode 的结果。
令 encoded string 为 encoding result 的 data。
返回成功，其数据为 encoded string

[CSSOM-VIEW] 定义了以下内容：
- getBoundingClientRect()（用于 Element）
- getClientRects()（用于 Element）
[DOM] 定义了以下内容：
- compareDocumentPosition()（用于 Node）
- connected
- 后代（用于 tree）
- document
- document 元素
- DOCUMENT_POSITION_DISCONNECTED（用于 Node）
- DOMTokenList 接口
- 元素
- Element 接口
- 事件
- 触发事件
- 按名称获取属性
- getAttribute()（用于 Element）
- getElementsByTagName()（用于 Element）
- hasAttribute()（用于 Element）
- HTMLCollection 接口
- 包含自身的祖先（用于 tree）
- 包含自身的后代（用于 tree）
- isTrusted 属性（用于 Event）
- 节点
- 节点文档（用于 Node）
- NodeList 接口
- querySelectorAll()（用于 ParentNode）
- 移除
- ShadowRoot 接口
- tagName 属性（用于 Element）
- textContent 属性（用于 Node）
- 类型（用于 Document）
[FILEAPI] 定义了以下内容：
- FileList 接口
[GEOMETRY-1] 定义了以下内容：
- DOMRect 接口
[HTML] 定义了以下内容：
- a 元素
- 活动浏览上下文（用于 navigable）
- address 元素
- canvas 元素
- 运行回调之后清理
- 运行脚本之后清理
- 内容 navigable（用于 navigable 容器）
- datalist 元素
- frame 元素
- height 属性（用于 canvas 元素）
- HTMLAllCollection 接口
- HTMLFormControlsCollection 接口
- HTMLOptionsCollection 接口
- iframe 元素
- 并行
- navigable
- Navigator 接口
- 节点 navigable
- optgroup 元素
- option 元素
- output 元素
- 已暂停
- 准备运行回调
- 准备运行脚本
- readonly 属性（用于 input 元素）
- 相关代理
- 相关设置对象
- select 元素
- textarea 元素
- title 属性（用于 Document）
- 顶级浏览上下文
- type 属性（用于 input 元素）
- width 属性（用于 canvas 元素）
- WorkerNavigator 接口
[INFRA] 定义了以下内容：
- 在……时中止
- ASCII 小写
- 包含（用于 list）
- 包含（用于 map）
- 继续（用于 iteration）
- 条目（用于 map）
- 获取值（用于 map）
- 如果已中止
- 项（用于 struct）
- 长度（用于 string）
- map
- 队列
- set
- 设置（用于 map）
- 大小（用于 map）
- struct
- While（用于 iteration）
[WEBDRIVER-BIDI] 定义了以下内容：
- BiDi 会话
[WEBIDL] 定义了以下内容：
- 一个新的 Promise
- 拒绝
- 解决

[accname-1.1]: 无障碍名称和描述计算 1.1. Joanmarie Diggs; Bryan Garaventa; Michael Cooper. W3C. 2018 年 12 月 18 日. W3C 推荐标准. URL: https://www.w3.org/TR/accname-1.1/
[CSP3]: 内容安全策略第 3 级. Mike West; Antonio Sartori. W3C. 2026 年 5 月 5 日. W3C 工作草案. URL: https://www.w3.org/TR/CSP3/
[CSS-CASCADE-4]: CSS 层叠与继承第 4 级. Elika Etemad; Tab Atkins Jr. W3C. 2022 年 1 月 13 日. W3C 候选推荐标准. URL: https://www.w3.org/TR/css-cascade-4/
[CSS-DEVICE-ADAPT]: CSS 设备适配模块第 1 级. Rune Lillesveen; Florian Rivoal; Matt Rakow. W3C. 2016 年 3 月 29 日. W3C 工作草案. URL: https://www.w3.org/TR/css-device-adapt-1/
[CSS21]: 层叠样式表第 2 级修订版 1（CSS 2.1）规范. Bert Bos; Tantek Çelik; Ian Hickson; Håkon Wium Lie. W3C. 2011 年 6 月 7 日. W3C 推荐标准. URL: https://www.w3.org/TR/CSS2/
[CSS3-BOX]: CSS 盒模型模块第 3 级. Elika Etemad. W3C. 2024 年 4 月 11 日. W3C 推荐标准. URL: https://www.w3.org/TR/css-box-3/
[CSS3-DISPLAY]: CSS 显示模块第 3 级. Elika Etemad; Tab Atkins Jr. W3C. 2023 年 3 月 30 日. W3C 候选推荐标准. URL: https://www.w3.org/TR/css-display-3/
[CSS3-VALUES]: CSS 值与单位模块第 3 级. Tab Atkins Jr.; Elika Etemad. W3C. 2024 年 3 月 22 日. CRD. URL: https://www.w3.org/TR/css-values-3/
[CSSOM]: CSS 对象模型（CSSOM）. Daniel Glazman; Emilio Cobos Álvarez. W3C. 2021 年 8 月 26 日. W3C 工作草案. URL: https://www.w3.org/TR/cssom-1/
[CSSOM-VIEW]: CSSOM 视图模块. Simon Fraser; Emilio Cobos Álvarez. W3C. 2025 年 9 月 16 日. W3C 工作草案. URL: https://www.w3.org/TR/cssom-view-1/
[DOM]: DOM 标准. Anne van Kesteren. WHATWG. 现行标准. URL: https://dom.spec.whatwg.org/
[DOM-PARSING]: DOM 解析与序列化. Travis Leithead. W3C. 2016 年 5 月 17 日. W3C 工作草案. URL: https://www.w3.org/TR/DOM-Parsing/
[ECMA-262]: ECMAScript 语言规范. Ecma International. URL: https://tc39.es/ecma262/multipage/
[EDITING]: HTML 编辑 API. A. Gregor. W3C. URL: https://dvcs.w3.org/hg/editing/raw-file/tip/editing.html
[ENCODING]: 编码标准. Anne van Kesteren. WHATWG. 现行标准. URL: https://encoding.spec.whatwg.org/
[FETCH]: Fetch 标准. Anne van Kesteren. WHATWG. 现行标准. URL: https://fetch.spec.whatwg.org/
[fileapi]: File API. Marijn Kruisselbrink. W3C. 2025 年 12 月 3 日. W3C 工作草案. URL: https://www.w3.org/TR/FileAPI/
[FULLSCREEN]: Fullscreen API 标准. Philip Jägenstedt. WHATWG. 现行标准. URL: https://fullscreen.spec.whatwg.org/
[GEOMETRY-1]: 几何接口模块第 1 级. Sebastian Zartner; Yehonatan Daniv. W3C. 2025 年 12 月 4 日. CRD. URL: https://www.w3.org/TR/geometry-1/
[HTML]: HTML 标准. Anne van Kesteren; Domenic Denicola; Dominic Farolino; Ian Hickson; Philip Jägenstedt; Simon Pieters. WHATWG. 活标准. URL: https://html.spec.whatwg.org/multipage/
[INFRA]: Infra 标准. Anne van Kesteren; Domenic Denicola. WHATWG. 现行标准. URL: https://infra.spec.whatwg.org/
[mediaqueries-4]: 媒体查询第 4 级. Tab Atkins Jr.; Florian Rivoal. W3C. 2026 年 2 月 19 日. CRD. URL: https://www.w3.org/TR/mediaqueries-4/
[PAGE-VISIBILITY]: 页面可见性（第二版）. Jatinder Mann; Arvind Jain. W3C. 2013 年 10 月 29 日. W3C 推荐标准. URL: https://www.w3.org/TR/page-visibility/
[POINTER-EVENTS]: 指针事件. Patrick Lauke; Robert Flack. W3C. 2026 年 2 月 25 日. W3C 工作草案. URL: https://www.w3.org/TR/pointerevents4/
[PROMISES-GUIDE]: 编写使用 Promise 的规范. Domenic Denicola. W3C. 2018 年 11 月 9 日. TAG 结论. URL: https://www.w3.org/2001/tag/doc/promises-guide
[RFC1928]: SOCKS 协议第 5 版. M. Leech; M. Ganis; Y. Lee; R. Kuris; D. Koblas; L. Jones. IETF. 1996 年 3 月. 提议标准. URL: https://www.rfc-editor.org/rfc/rfc1928
[RFC2397]: "data" URL 方案. L. Masinter. IETF. 1998 年 8 月. 提议标准. URL: https://www.rfc-editor.org/rfc/rfc2397
[RFC3514]: IPv4 标头中的安全标志. S. Bellovin. IETF. 2003 年 4 月 1 日. 信息性. URL: https://www.rfc-editor.org/rfc/rfc3514
[RFC4122]: 通用唯一标识符（UUID）URN 命名空间. P. Leach; M. Mealling; R. Salz. IETF. 2005 年 7 月. 提议标准. URL: https://www.rfc-editor.org/rfc/rfc4122
[RFC4632]: 无类别域间路由（CIDR）：Internet 地址分配与聚合计划. V. Fuller; T. Li. IETF. 2006 年 8 月. 当前最佳实践. URL: https://www.rfc-editor.org/rfc/rfc4632
[RFC4648]: Base16、Base32 和 Base64 数据编码. S. Josefsson. IETF. 2006 年 10 月. 提议标准. URL: https://www.rfc-editor.org/rfc/rfc4648
[RFC6265]: HTTP 状态管理机制. A. Barth. IETF. 2011 年 4 月. 提议标准. URL: https://httpwg.org/specs/rfc6265.html
[RFC6265bis]: Cookies：HTTP 状态管理机制. M. West; J. Wilander. IETF. 草案. URL: https://tools.ietf.org/html/draft-ietf-httpbis-rfc6265bis-05
[RFC7230]: 超文本传输协议（HTTP/1.1）：消息语法与路由. R. Fielding, Ed.; J. Reschke, Ed. IETF. 2014 年 6 月. 提议标准. URL: https://httpwg.org/specs/rfc7230.html
[RFC7231]: 超文本传输协议（HTTP/1.1）：语义与内容. R. Fielding, Ed.; J. Reschke, Ed. IETF. 2014 年 6 月. 提议标准. URL: https://httpwg.org/specs/rfc7231.html
[RFC7232]: 超文本传输协议（HTTP/1.1）：条件请求. R. Fielding, Ed.; J. Reschke, Ed. IETF. 2014 年 6 月. 提议标准. URL: https://httpwg.org/specs/rfc7232.html
[RFC7234]: 超文本传输协议（HTTP/1.1）：缓存. R. Fielding, Ed.; M. Nottingham, Ed.; J. Reschke, Ed. IETF. 2014 年 6 月. 提议标准. URL: https://httpwg.org/specs/rfc7234.html
[RFC7235]: 超文本传输协议（HTTP/1.1）：认证. R. Fielding, Ed.; J. Reschke, Ed. IETF. 2014 年 6 月. 提议标准. URL: https://httpwg.org/specs/rfc7235.html
[UAX29]: Unicode 文本分段. Josh Hadley. Unicode Consortium. 2025 年 8 月 17 日. Unicode 标准附录 #29. URL: https://www.unicode.org/reports/tr29/tr29-47.html
[UAX44]: Unicode 字符数据库. Ken Whistler. Unicode Consortium. 2025 年 8 月 27 日. Unicode 标准附录 #44. URL: https://www.unicode.org/reports/tr44/tr44-36.html
[UI-EVENTS]: UI 事件. Xiaoqian Wu. W3C. 2026 年 2 月 21 日. W3C 工作草案. URL: https://www.w3.org/TR/uievents/
[UIEVENTS-KEY]: UI Events KeyboardEvent key 值. Travis Leithead; Gary Kacmarcik. W3C. 2025 年 4 月 22 日. W3C 推荐标准. URL: https://www.w3.org/TR/uievents-key/
[Unicode]: Unicode 标准. Unicode Consortium. URL: https://www.unicode.org/versions/latest/
[URI-TEMPLATE]: URI 模板. J. Gregorio; R. Fielding; M. Hadley; M. Nottingham; D. Orchard. IETF. 2012 年 3 月. 提议标准. URL: https://www.rfc-editor.org/rfc/rfc6570
[URL]: URL 标准. Anne van Kesteren. WHATWG. 现行标准. URL: https://url.spec.whatwg.org/
[wai-aria-1.2]: 无障碍富互联网应用（WAI-ARIA） 1.2. Joanmarie Diggs; James Nurthen; Michael Cooper; Carolyn MacLeod. W3C. 2023 年 6 月 6 日. W3C 推荐标准. URL: https://www.w3.org/TR/wai-aria-1.2/
[WebDriver-BiDi]: WebDriver BiDi. James Graham; Alex Rudenko; Maksim Sadym. W3C. 2026 年 3 月 19 日. W3C 工作草案. URL: https://www.w3.org/TR/webdriver-bidi/
[WEBIDL]: Web IDL 标准. Edgar Chen; Timothy Gu. WHATWG. 现行标准. URL: https://webidl.spec.whatwg.org/
[XPATH]: XML 路径语言（XPath）版本 1.0. James Clark; Steven DeRose. W3C. 1999 年 11 月 16 日. W3C 推荐标准. URL: https://www.w3.org/TR/xpath-10/

WebDriver

摘要

本文档的状态

1. 设计

1.1 兼容性

1.2 简洁性

1.3 扩展

2. 一致性

3. 术语

4. 接口

5. 节点

6. 协议

6.1 算法

6.2 命令

6.3 处理模型

6.4 路由请求

6.5 端点

6.6 错误

6.7 扩展

7. 能力

7.1 代理

7.2 处理能力

8. 会话

8.1 全局状态

8.2 新建会话

8.3 删除会话

8.4 状态

9. 超时

9.1 获取超时

9.2 设置超时

10. 导航

10.1 导航到

10.2 获取当前 URL

10.3 后退

10.4 前进

10.5 刷新

10.6 获取标题

11. 上下文

11.1 获取窗口句柄

11.2 关闭窗口

11.3 切换到窗口

11.4 获取窗口句柄列表

11.5 新建窗口

11.6 切换到框架

11.7 切换到父框架

11.8 调整窗口大小和定位 窗口

11.8.1 获取窗口矩形

11.8.2 设置窗口矩形

11.8.3 最大化窗口

11.8.4 最小化窗口

11.8.5 全屏窗口

12. 元素

12.1 可交互性

12.2 Shadow Root

12.3 检索

12.3.1 定位器策略

12.3.1.1 CSS 选择器

12.3.1.2 链接文本

12.3.1.3 部分链接文本

12.3.1.4 标签名称

12.3.1.5 XPath

12.3.2 查找元素

12.3.3 查找元素列表

12.3.4 从元素查找元素

12.3.5 从元素查找元素列表

12.3.6 从 Shadow Root 查找元素

12.3.7 从 Shadow Root 查找元素列表

12.3.8 获取活动元素

12.3.9 获取 元素 Shadow Root

12.4 状态

12.4.1 元素是否被选中

12.4.2 获取 元素属性

12.4.3 获取 元素属性值

12.4.4 获取 元素 CSS 值

12.4.5 获取元素文本

12.4.6 获取 元素标签名称

12.4.7 获取元素矩形

12.4.8 元素是否启用

12.4.9 获取计算角色

12.4.10 获取 计算标签

11.8 调整窗口大小和定位窗口

12.3.9 获取元素 Shadow Root

12.4.2 获取元素属性

12.4.3 获取元素属性值

12.4.4 获取元素 CSS 值

12.4.6 获取元素标签名称

12.4.10 获取计算标签

E.1 本规范定义的术语