HTML 中语音呈现规范

摘要

通过文本转语音（TTS）合成实现准确发音在许多上下文中都非常重要，并且在教育、出版、通信、娱乐等领域至关重要。TTS 已成为一项重要技术，用于提供对 Web 上数字内容的访问。然而，目前还没有办法标记内容，使其能够在常用的 TTS 引擎和操作环境中正确呈现 TTS 生成的输出。

我们在本出版物中确定了两种标记方法，以便为内容作者提供可靠的 HTML 内容发音，而不受用户可能选择使用的操作环境（或辅助技术）的影响。每种方法都已被证明能够产生一致的结果。我们希望获得作者和实现者的反馈，以帮助确定哪种方法应由 W3C 推进为规范性推荐标准状态。

我们将每种候选方法建立在语音合成标记语言（SSML）的一个子集之上。我们选定的子集经过谨慎选择，旨在为各种辅助技术和操作环境中的语音呈现带来一致性和可预测性。本出版物中描述的两种技术方法都谨慎地避免了阻碍 SSML 成为原生 HTML 技术的僵局，因此应当具有普遍适用性。这里描述的任一种方法都满足我们对辅助技术的要求，并且对消费和以语音形式呈现 HTML 内容的语音助手也会有用。我们希望获得反馈，以了解哪种方法在 Web 内容语音呈现的所有应用中最易实现。

1. 引言

本节为非规范性内容。

在这份首次公开工作草案（FPWD）出版物中，我们定义了两种独立的方法，用于实现文本转语音（TTS）引擎在所有操作环境中的准确、一致且可靠的发音，而不受同时使用的任何辅助技术的影响。我们现在发布两种方法，是为了从更广泛的社区获得反馈，了解这两种方法中哪一种被认为更可取——以及原因。

文本转语音对残障人士是必要的，对所有人也有用。准确发音在许多情况下都至关重要，例如教育和教育评估（测试学生）。如今许多计算机和移动设备都内置了 TTS 功能，该功能也常被非残障人士在不同情境中使用，例如驾驶时或与个人数据助手交互时。

W3C 的 Web 内容无障碍指南（WCAG）强调了正确发音的重要性。

例如，在英语中，同形异音异义词是指拼写相同但发音和含义不同的词，例如 desert（放弃）和 desert（干旱地区）这两个词。…… 此外，在某些语言中，某些字符可以以不同方式发音。例如在日语中，有像汉字（Kanji）这样的字符具有多种发音。 ……如果读错，内容对用户来说就没有意义。理解成功准则 3.1.6：发音

虽然 WCAG 提供了许多用于指示正确发音的变通方法，但它仍被迫将成功准则 3.1.6 归类为 AAA，因为它无法指向可靠的技术解决方案。

W3C 有两项成熟的发音相关规范：

语音合成标记语言（SSML）
发音词典规范（PLS）

这些规范长期以来提供了技术方法，允许作者在其 HTML 文档中嵌入发音（以及相关语音呈现）标记，但由于若干技术原因，SSML 的方法尚未被采用。此外，来自不同浏览器和辅助技术供应商的反馈表明，这不是一种可能或可行的方法。因此，在我们的规范中，我们并不试图重新发明这个轮子，而是弥合长期存在的技术障碍，这些障碍一直阻碍 SSML 在 HTML 中的使用。我们的方法直接依赖这两项规范，将它们包装为 HTML 验证会接受的属性。

如前所述，我们确定了两种候选方法：

多属性 — 使用一个或多个具有字符串值的元素属性来传达每个 SSML 功能和属性。
单属性 — 使用单个元素属性，其中包含一个 JavaScript 对象表示法（JSON）字符串，以传达所有 SSML 功能和属性。

任务组鼓励实现者和作者就这些方法提供反馈。反馈经过分析后，将帮助确定哪种方法将成为最终的规范性 W3C 推荐标准。

以下各节包含每种方法的示例代码。请参阅示例内容示例，其中包含音频文件，可与现有 TTS 技术进行比较。

编辑者注

使用 data- 前缀来命名属性并不是编辑者的推荐或偏好。相反，这是 HTML 5.x 规范中定义的、开发 HTML 增强功能的规范方法。这种基于标准的开发方法支持实验性实现，而这些实现又将为本规范的进一步发展提供信息。

如需更深入地了解发音问题和相关 W3C 文档，请参阅发音概述。

2. 在 HTML 中包含 SSML 的多属性方法

通过将 SSML 标签和属性转换为 HTML 属性，作者可以在其 HTML 文档中嵌入发音（以及相关语音呈现）。作者可以将大多数受支持的标签彼此组合，以应用多种语音效果。

SSML 中包含的大多数标记都适合大多数内容开发者使用；然而，某些功能，例如 phoneme 和 prosody，可能需要专业知识。日本的出版商对 SSML phoneme 元素使用了一种来自 EPUB 3 的类似技术。

Edgar Allen Poe 的 The Raven：

示例 1

<p data-ssml-prosody-rate="slow" data-ssml-prosody-pitch="low">
    Once upon a midnight 
    <span data-ssml-phoneme-alphabet="ipa" data-ssml-phoneme-ph="ˈdrɪəri">dreary</span>
    <span data-ssml-break-time="500ms"></span>,
    while I pondered, weak
    <span data-ssml-break-time="150ms"></span> and weary,<br data-ssml-break-time="500ms" />
    Over many a quaint and curious volume of forgotten
    <span data-ssml-prosody-rate="x-slow" data-ssml-prosody-pitch="low"> lore—</span><br />
    While I nodded, nearly napping, suddenly there came a tapping,
    <br data-ssml-audio-src="/soundlibrary/wood/hits/hits_11" />
    As of some one gently rapping,
    <span data-ssml-audio-src="/soundlibrary/wood/hits/hits_11"></span>
    rapping at my chamber door.
    <span data-ssml-audio-src="/soundlibrary/wood/hits/hits_11"></span>
    <br data-ssml-audio-src="/soundlibrary/wood/hits/hits_11" />
    <span data-ssml-prosody-volume="x-soft" data-ssml-prosody-rate="medium">
      "'Tis some visitor,"
    </span>
    I muttered, <span data-ssml-prosody-volume="x-soft" data-ssml-prosody-rate="x-slow">
    <span data-ssml-phoneme-alphabet="ipa" data-ssem-phoneme-ph="tæpɪŋ">"tapping</span>
    at my chamber door—</span><br data-ssml-break-time="750ms" />
    Only this <span data-ssml-break-strength="weak"></span> and nothing
    <span data-ssml-break-strength="none"></span>
    <span data-ssml-prosody-volume="soft" data-ssml-prosody-rate="75%"> more."</span>
</p>

2.1 `data-ssml-*` 多属性集

这些属性提供与 SSML 对应项的功能等价性。这些属性在以下 HTML 元素上有效：

2.1.1 `data-ssml-say-as(-*)`

允许作者对元素的文本内容进行分类。这些属性派生自 SSML say-as 元素及其相关属性。

编辑者注

interpret-as 似乎是多余的，并且应当是隐含的

`data-ssml-say-as`

`data-ssml-say-as-format`（可选）

值：如 W3C 说明、SSML say-as 属性值中定义的时间/日期格式。SSML 1.0 say-as 属性

`data-ssml-say-as-detail`（可选）

值：如 W3C 说明、SSML say-as 属性值中定义的 detail。SSML 1.0 say-as 属性

编辑者注

data-ssml-say-as-detail 属性允许作者针对特定于实现的 TTS 引擎功能或行为。

示例 2

According the 2010 US Census, the population of <span data-ssml-say-as='characters'>90274</span>
increased to 25209 from 24976 over the past 10 years.

2.1.2 `data-ssml-phoneme-*`

为音位/语音发音定义两个必需属性。带有 phoneme 属性的元素只能包含文本（不能包含元素）。这些属性派生自 SSML phoneme 元素及其相关属性。

`data-ssml-phoneme-ph`

值：音位字符串。

`data-ssml-phoneme-alphabet`

值：所使用的音标字母表。ipa | x-sampa

示例 3

Once upon a midnight <span data-ssml-alphabet="ipa" data-ssml-phoneme-ph="ˈdrɪəri">dreary</span>

2.1.3 `data-ssml-sub-alias`

一个用来替换文本内容以供发音的字符串值。虽然类似于 aria-label，但 alias 不会改变拼写（即盲文显示）。此外，alias 属性可由不访问无障碍树的 TTS 技术使用。处理器应当对 alias 值应用文本规范化。该属性派生自 SSML sub 元素及其相关属性。

值：要替换并传递给 TTS 进行呈现的文本字符串。

示例 4

<span data-ssml-sub-alias="Sodium Chloride">NaCL</span>

2.1.4 `data-ssml-voice-*`

一组定义产生值的属性，用于请求改变说话声音。voice 元素有两类属性：一类表示期望的声音特征，另一类控制行为。这些属性派生自 SSML voice 元素及其相关属性。

`data-ssml-voice-gender`（可选）

值：female | male | neutral

`data-ssml-voice-age`（可选）

值：对应年龄（以年为单位）的 integer

`data-ssml-voice-variant`（可选）

值：表示数字声音变体的 integer

`data-ssml-voice-name`（可选）

值：从当前 TTS 引擎请求的特定声音名称（例如 "David"）。

`data-ssml-voice-languages`（可选）

值：string，一个或多个由空格分隔、由该声音朗读的语言列表。

编辑者注

data-ssml-voice-languages 属性仅帮助 TTS 引擎选择适当的声音。它并不指示内容的语言。若要指定语言，请使用 HTML lang 属性。

示例 5

She said, "<span data-ssml-voice-gender="female">My name is Marie</span>".

2.1.5 `data-ssml-emphasis-level`

请求以强调方式朗读文本内容（也称为突出或重音）。这是一个单一属性，派生自 SSML emphasis 元素及其相关属性。

值：strong | moderate | none | reduced

示例 6

Please use <span data-ssml-emphasis-level="strong">extreme caution.</span>

2.1.6 `data-ssml-break-*`

描述与空元素关联的时序，用于控制标记之间的停顿或其他韵律边界。在任意一对标记之间使用 break 属性是可选的。如果元素不存在于标记之间，合成处理器应根据语言上下文自动确定停顿。这些属性派生自 SSML break 元素及其相关属性。

`data-ssml-break-strength`

`data-ssml-break-time`

值：string，包含以数字形式表示的时间时长，如 "250ms"、"1s" 等。

示例 7

Take a deep breath,<span data-ssml-break-time="1s"></span> and exhale.

2.1.7 `data-ssml-prosody-*`

允许控制语音输出的音高、语速和音量。这些属性派生自 SSML prosody 元素及其相关属性。

`data-ssml-prosody-pitch`（可选）

`data-ssml-prosody-contour`（可选）

值：如 SSML 1.1 推荐标准中定义的轮廓变化参数的 string。

`data-ssml-prosody-range`（可选）

值：如 SSML 1.1 推荐标准中定义的 string range 值。

`data-ssml-prosody-rate`（可选）

`data-ssml-prosody-duration`（可选）

值：string，包含时间时长（例如 "250ms"、 "1s" 等）。

`data-ssml-prosody-volume`（可选）

示例 8

The tortoise, said (slowly) "<span data-ssml-prosody-rate="x-slow">
I am almost at the finish line</span>."

2.1.8 `data-ssml-audio-*`

支持将录制的音频文件与合成语音输出结合插入。元素可以为空。如果元素不为空，则当音频文档不可用时，应朗读其内容。这些属性派生自 SSML audio 元素及其相关属性。

`data-ssml-audio-src`

值：带有适当媒体文件的文档 URI。

`data-ssml-audio-fetchtimeout` （可选）

值：string，包含时间时长（例如 "250ms"、 "1s" 等）。

`data-ssml-audio-fetchint`（可选）

值：safe | prefetch

`data-ssml-audio-maxage`（可选）

值：string

`data-ssml-audio-maxstale`（可选）

值：string

`data-ssml-audio-clipBegin`（可选）

值：string，包含时间时长（例如 "250ms"、 "1s" 等）。

`data-ssml-audio-clipEnd`（可选）

值：string，包含时间时长（例如 "250ms"、 "1s" 等）。

`data-ssml-audio-repeatCount`（可选）

值：integer，表示重复播放音频片段的次数。

`data-ssml-audio-repeatDur`（可选）

值：string，包含时间时长（例如 "250ms"、 "1s" 等）。

示例 9

You will hear a brief chime <span data-ssml-audio-src="/audio/chime.ogg"></span> 
when your time is up.

3. 在 HTML 中包含 SSML 的单属性方法

通过将 SSML 标签和属性转换为一个带有 JSON 字符串值的单个 HTML 属性，作者可以在其 HTML 文档中嵌入发音（以及相关语音呈现）。作者可以将大多数受支持的标签彼此组合，以应用多种语音效果。

SSML 中包含的大多数标记都适合大多数内容开发者使用；然而，某些功能，例如 phoneme 和 prosody，可能需要专业知识。这种方法是作为转换符合 IMS Question & Test Interoperability（QTI）规范的内容的一种手段出现的。QTI 标准支持在 HTML 中包含 SSML，以用于教育评估中的 TTS 工具。

Edgar Allen Poe 的 The Raven：

示例 1

<p data-ssml='{"prosody":{"rate":"slow","pitch":"low"}}'>
	Once upon a midnight
        <span data-ssml='{"phoneme":{"alphabet":"ipa","ph":"ˈdrɪəri"}}'>dreary</span>
	<span data-ssml='{"break":{"time":"500ms"}'></span>,
	while I pondered, weak
	<span data-ssml='{"break":{"time":"150ms"}'></span> and weary,
        <br data-ssml='{"break":{"time":"500ms"}' />
	Over many a quaint and curious volume of forgotten 
	<span data-ssml='{"prosody":{"rate":"x-slow","pitch":"low"}}'>lore—</span><br />
	While I nodded, nearly napping, suddenly there came a tapping,
	<br data-ssml='{"audio":{"src":"/soundlibrary/wood/hits/hits_11"}}'/>
	As of some one gently rapping,
	<span data-ssml='{"audio":{"src":"/soundlibrary/wood/hits/hits_11"}}'></span>
	rapping at my chamber door.
	<span data-ssml='{"audio":{"src":"/soundlibrary/wood/hits/hits_11"}}'></span>
	<br data-ssml='{"audio":{"src":"/soundlibrary/wood/hits/hits_11"}}' />
	<span data-ssml='{"prosody":{"volume":"x-soft","rate":"medium"}}'>
          "'Tis some visitor,"
        </span>
	I muttered, <span data-ssml='{"prosody":{"volume":"x-soft","rate":"x-slow"}}'>
	<span data-ssml='{"phoneme":{"alphabet":"ipa","ph":"tæpɪŋ"}}'>"tapping</span>
	at my chamber door—</span><br data-ssml='{"break":{"time":"750ms"}'/>
	Only this<span data-ssml='{"break":{"strength":"weak"}'></span>
	and nothing<span data-ssml='{"break":{"strength":"none"}'> </span>
	<span data-ssml='{"prosody":{"volume":"soft","rate":"75%"}}'>more."</span>
</p>

3.1 `data-ssml` 属性、性质和值

以下性质已被定义，并提供与其 SSML 对应项的功能等价性。

data-ssml 提供与 SSML 的功能等价性。该属性在以下 HTML 元素上有效：

data-ssml 属性的值是一个 JSON 字符串，用单引号（'）括起，其中包含一个表示特定 SSML 功能的单个 JSON 对象，并带有一个或多个性质/值对。有效的对象、性质和相关值在以下各节中定义。 JSON 架构见附录 A。

3.1.1 `say-as`

允许作者对元素的文本内容进行分类。JSON 定义派生自 SSML say-as 元素及其相关属性。

`interpret-as`

`format`（可选）

值：如 W3C 说明 SSML say-as 属性值中定义的时间/日期格式。

`detail`（可选）

值：如 W3C 说明 SSML say-as 属性值中定义的 detail。

编辑者注

detail 性质允许作者针对特定于实现的 TTS 引擎功能或行为。

示例 2

According the 2010 US Census, the population of 
<span data-ssml='{"say-as":{"interpret-as":"characters"}}'>90274</span>
increased to 25209 from 24976 over the past 10 years.

3.1.2 `phoneme`

为音位/语音发音定义两个必需属性。带有 phoneme 属性的元素只能包含文本（不能包含元素）。 JSON 定义派生自 SSML phoneme 元素及其相关属性。

`ph`

值：string，包含与要朗读内容对应的语音字符

`data-ssml-phoneme-alphabet`

值：ipa | x-sampa，定义用于 ph 字符串的音标字母表

示例 3

Once upon a midnight 
<span data-ssml='{"phoneme":{"alphabet":"ipa","ph":"ˈdrɪəri"}}'>dreary</span>

3.1.3 `sub`

表示 alias 属性值中的文本会替换文本内容用于发音。必需的 alias 性质指定要朗读的字符串，以替代文本内容。处理器应当对 alias 值应用文本规范化。 JSON 定义派生自 SSML sub 元素及其相关属性。

`alias`

值：string，包含要作为应用了 sub 的元素的文本内容的替代内容来朗读的文本。

示例 4

<span data-ssml='{"sub":{"alias":"Sodium Chloride"}}'>NaCL</span>

3.1.4 `voice`

请求改变说话声音。voice 有两类属性：一类表示期望的声音特征，另一类控制行为。JSON 定义派生自 SSML voice 元素及其相关属性。

`gender`（可选）

值：female | male | neutral

`age`（可选）

值：对应年龄（以年为单位）的 integer

`variant`（可选）

值：表示数字声音变体的 integer

`name`（可选）

值：string，定义从当前 TTS 引擎请求的特定声音名称，例如 "Microsoft David (English)"

`languages`（可选）

值：string，一个或多个由空格分隔、由该声音朗读的语言列表。

编辑者注

voice > languages 性质仅帮助 TTS 引擎选择适当的声音。它并不指示内容的语言。若要指定语言，请使用 HTML lang 属性。

示例 5

She said, "<span data-ssml='{"voice":{"gender":"female"}}'>My name is Marie</span>".

3.1.5 `emphasis`

请求将应用 emphasis 的元素的文本内容以强调方式朗读（也称为突出或重音）。JSON 定义派生自 SSML emphasis 元素及其相关属性。

`level`

值：strong | moderate | none | reduced

示例 6

Please use <span data-ssml='{"emphasis":{"level":"strong"}}'>extreme caution.</span>

3.1.6 `break`

描述与空元素关联的时序，用于控制标记之间的停顿或其他韵律边界。在任意一对标记之间使用 break 是可选的。如果元素不存在于标记之间，合成处理器应当根据语言上下文自动确定停顿。JSON 定义派生自 SSML break 元素及其相关属性。

`strength`

`time`

值：string，包含以数字形式表示的时间时长，如 "250ms"、"1s" 等。（s=秒，ms=毫秒）

示例 7

Take a deep breath,<span data-ssml='{"break":{"time":"1s"}}'></span> and exhale.

3.1.7 `prosody`

允许控制语音输出的音高、语速和音量。该对象有六个性质。JSON 定义派生自 SSML prosody 元素及其相关属性。

`pitch`

`contour`

值：如 SSML 1.1 推荐标准中定义的轮廓变化参数的 string

`range`

值：如 SSML 1.1 推荐标准中定义的 string range 值

`rate`

`duration`

值：string，包含以数字形式表示的时间时长，如 "250ms"、"1s" 等。

`volume`

示例 8

The tortoise, said (slowly) "
<span data-ssml='{"prosody":{"rate":"x-slow"}}'>I am almost at the finish line</span>."

3.1.8 `audio`

支持将录制的音频文件与合成语音输出结合插入。元素可以为空。如果元素不为空，则其内容应为在音频文档不可用时要朗读的文本。JSON 定义派生自 SSML audio 元素及其相关属性。

`src`

值：带有适当媒体文件的文档 URI。

`fetchtimeout`

值：string，包含以数字形式表示的时间时长，如 "250ms"、"1s" 等。

`fetchint`

值：safe | prefetch

`maxage`

值：string

`maxstale`

值：string

`clipBegin`

值：string，包含以数字形式表示的时间时长，如 "250ms"、"1s" 等。

`clipEnd`

值：string，包含以数字形式表示的时间时长，如 "250ms"、"1s" 等。

`repeatCount`

值：integer，表示重复播放音频片段的次数。

`repeatDur`

值：string，包含以数字形式表示的时间时长，如 "250ms"、"1s" 等。

示例 9

You will hear a brief chime 
<span data-ssml='{"audio":{"src":"/audio/chime.ogg"}}'></span> when your time is up.

HTML 中语音呈现规范

W3C 工作草案 2021年9月23日

摘要

本文档状态

1. 引言

2. 在 HTML 中包含 SSML 的多属性方法

2.1 data-ssml-* 多属性集

2.1.1 data-ssml-say-as(-*)

data-ssml-say-as

data-ssml-say-as-format（可选）

data-ssml-say-as-detail（可选）

2.1.2 data-ssml-phoneme-*

data-ssml-phoneme-ph

data-ssml-phoneme-alphabet

2.1.3 data-ssml-sub-alias

2.1.4 data-ssml-voice-*

data-ssml-voice-gender（可选）

data-ssml-voice-age（可选）

data-ssml-voice-variant（可选）

data-ssml-voice-name（可选）

data-ssml-voice-languages（可选）

2.1.5 data-ssml-emphasis-level

2.1.6 data-ssml-break-*

data-ssml-break-strength

data-ssml-break-time

2.1.7 data-ssml-prosody-*

data-ssml-prosody-pitch（可选）

data-ssml-prosody-contour（可选）

data-ssml-prosody-range（可选）

data-ssml-prosody-rate（可选）

data-ssml-prosody-duration（可选）

data-ssml-prosody-volume（可选）

2.1.8 data-ssml-audio-*

data-ssml-audio-src

data-ssml-audio-fetchtimeout （可选）

data-ssml-audio-fetchint（可选）

data-ssml-audio-maxage（可选）

data-ssml-audio-maxstale（可选）

data-ssml-audio-clipBegin（可选）

data-ssml-audio-clipEnd（可选）

data-ssml-audio-repeatCount（可选）

data-ssml-audio-repeatDur（可选）

3. 在 HTML 中包含 SSML 的单属性方法

3.1 data-ssml 属性、性质和值

3.1.1 say-as

interpret-as

format（可选）

detail（可选）

3.1.2 phoneme

ph

data-ssml-phoneme-alphabet

3.1.3 sub

alias

3.1.4 voice

gender（可选）

age（可选）

variant（可选）

name（可选）

languages（可选）

3.1.5 emphasis

level

3.1.6 break

strength

time

3.1.7 prosody

pitch

contour

range

rate

duration

volume

3.1.8 audio

src

fetchtimeout

fetchint

maxage

maxstale

clipBegin

clipEnd

repeatCount

2.1 `data-ssml-*` 多属性集

2.1.1 `data-ssml-say-as(-*)`

`data-ssml-say-as`

`data-ssml-say-as-format`（可选）

`data-ssml-say-as-detail`（可选）

2.1.2 `data-ssml-phoneme-*`

`data-ssml-phoneme-ph`

`data-ssml-phoneme-alphabet`

2.1.3 `data-ssml-sub-alias`

2.1.4 `data-ssml-voice-*`

`data-ssml-voice-gender`（可选）

`data-ssml-voice-age`（可选）

`data-ssml-voice-variant`（可选）

`data-ssml-voice-name`（可选）

`data-ssml-voice-languages`（可选）

2.1.5 `data-ssml-emphasis-level`

2.1.6 `data-ssml-break-*`

`data-ssml-break-strength`

`data-ssml-break-time`

2.1.7 `data-ssml-prosody-*`

`data-ssml-prosody-pitch`（可选）

`data-ssml-prosody-contour`（可选）

`data-ssml-prosody-range`（可选）

`data-ssml-prosody-rate`（可选）

`data-ssml-prosody-duration`（可选）

`data-ssml-prosody-volume`（可选）

2.1.8 `data-ssml-audio-*`

`data-ssml-audio-src`

`data-ssml-audio-fetchtimeout` （可选）

`data-ssml-audio-fetchint`（可选）

`data-ssml-audio-maxage`（可选）

`data-ssml-audio-maxstale`（可选）

`data-ssml-audio-clipBegin`（可选）

`data-ssml-audio-clipEnd`（可选）

`data-ssml-audio-repeatCount`（可选）

`data-ssml-audio-repeatDur`（可选）

3.1 `data-ssml` 属性、性质和值

3.1.1 `say-as`

`interpret-as`

`format`（可选）

`detail`（可选）

3.1.2 `phoneme`

`ph`

`data-ssml-phoneme-alphabet`

3.1.3 `sub`

`alias`

3.1.4 `voice`

`gender`（可选）

`age`（可选）

`variant`（可选）

`name`（可选）

`languages`（可选）

3.1.5 `emphasis`

`level`

3.1.6 `break`

`strength`

`time`

3.1.7 `prosody`

`pitch`

`contour`

`range`

`rate`

`duration`

`volume`

3.1.8 `audio`

`src`

`fetchtimeout`

`fetchint`

`maxage`

`maxstale`

`clipBegin`

`clipEnd`

`repeatCount`

`repeatDur`