解釋「讀出」網站的五種方法。

2024/11/28

現在所有網站都必須是可存取的、「讀出網站」。這些功能和工具是無障礙支援和改善使用者體驗的重要部分。

網站閱讀功能不僅能幫助視障及其他不同使用者平等地存取網路資訊，也是支援「邊工作邊閱讀」的工具。

閱讀網站有五種典型的方法，包括

方法 1：使用瀏覽器的讀出功能。
方法 2：使用螢幕閱讀器
方法 3：外掛程式整合。
方法 4：使用語音合成 API
方法 5：提供視訊和音訊內容。

本文將介紹這五種典型的語音讀取方法，並詳細說明其特點、如何導入以及語音讀取功能所面臨的挑戰。

閱讀網站的 5 種方法

首先，介紹了五種實現網站讀取功能的方法；下表對每種方法進行了比較和總結。

五種網站閱讀方法比較表

方法	特點	範圍	優勢。	赏罚
(1) 使用瀏覽器的讀取功能	網頁瀏覽器的標準功能，並可在設定中使用	整個瀏覽器	・無引進成本可用於可透過瀏覽器設定輕鬆啟用，使用者可立即使用。	......經常以單調的聲音大聲朗讀。・僅適用於特定瀏覽器和作業系統
(ii) 使用螢幕閱讀器。	主要為視障人士設計的輔助技術，可跨作業系統和應用程式使用的工具。	整體系統和應用程式	支援一般的無障礙環境，以及全系統可用 ...還有一些支援點字輸出。	需要設定和安裝，對健全人來說可能很麻煩。・有些工具是收費提供的。
(iii) 插件整合。	在網站上嵌入程式碼或其他資料，以讀出特定內容。	特定網站和網頁	・針對特定內容的最佳化表單在可進行客製化。	・這需要大量的時間和努力才能實現。功能範圍取決於所安裝的外掛程式。
(iv) 使用文字轉語音 API。	可產生更高品質、更自然的聲音，並可用於任何需要聲音的場合。	範圍從網站和應用程式到 IoT 裝置、內容創作、聊天機器人等。	... 進階的客製化和可產生自然語音。優異的多語言支援。	對開發人員而言，實施的技術障礙很高。・營運成本高
(v) 提供視訊和音訊內容。	以音訊和視訊內容的方式讀取資訊。	僅限於特定內容（音訊和視訊）	... 以及音訊。使用視覺和音樂能可專注於特定內容。	・耗時的內容創作 ... 缺乏即時效能。

主要是網站讀取的方式，雖然對於 (iii)、(iv) 和 (v) 可以提供高度精確的讀取、網站經營者的開發和生產有必要：

另一方面，對於(1)和(2)，網站端並不需要特別的開發，因為使用者端所使用的瀏覽器設定和工具，只是為了讓瀏覽器的閱讀功能和螢幕閱讀器能正常運作，而讀出資訊、網站結構、HTML 及其他描述方法符合 WCAG 等無障礙標準。有必要：

以下將詳細解釋每種方法，包括如何導入。

方法 1：使用瀏覽器的讀出功能。

在 Google Chrome 和 Safari 等網路瀏覽器中使用標準讀出功能。無需安裝特殊應用程式或軟體。它可以使用，並透過簡單的設定為使用者提供文字轉語音功能，不僅對視障人士有用，對需要在「同時工作」時檢索資訊的健全人士也很有用。

但是，它只能在瀏覽器中使用、視障人士的功能有限，因為它不像螢幕閱讀器一樣適用於整個系統可以說：

代表服務

・Microsoft Edge
・野生動物園（Mac）
・Google Chrome 瀏覽器

導入方法

從各個瀏覽器的設定選單中開啟讀出功能；如果您想使用額外的瀏覽器擴充套件，可以先在瀏覽器中安裝擴充套件，然後啟用該功能，例如在 Chrome 瀏覽器中、朗讀提供了諸如此類的擴展功能。

方法 2：使用螢幕閱讀器

螢幕閱讀器是專為視障人士設計的輔助技術，是將螢幕上的資訊轉換成口語或點字形式的工具，不僅限於網頁瀏覽器、可在整個系統中使用，包括作業系統和應用程式的特點是：

代表工具

NVDA 日文版
 說員
 PC-Talker
JAWS 2024 日語版
 ZoomText 2024 日文版

導入方法

安裝方法因工具而異，但一般都是從官方網站下載或購買授權後進行安裝、智慧型手機將螢幕閱讀器列為標準配備。在 iOS 上，從「設定」中的「輔助功能」功能表。VoiceOver"和 Android。「TalkBack」啟動讀出功能。

適用於螢幕閱讀器、以下文章對此有更詳細的說明，歡迎您連同本文一起閱讀。。

相關文章：說明如何使用螢幕閱讀器以及五種典型的工具。

方法 3：外掛程式整合。

外掛程式可讓您輕鬆地在網站上新增讀取功能。針對特定內容 (例如產品說明、文章、常見問題等) 提供讀取功能。這可讓操作者根據網站的目的靈活自訂功能，並透過自訂設定，例如直覺且易於使用的介面，包括讀數範圍的規格以及語音的開始和停止按鈕。也可以提供給使用者。

代表外掛程式

UniWeb
讀取喇叭
 大聲瀏覽

導入方法

一般的執行方法是在服務網站上選擇適當的外掛程式、只需在 HTML 標頭中插入提供者的腳本代碼即可實現。。文字範圍和按鈕設計可在管理畫面上自訂。

方法 4：使用語音合成 API

文字轉語音 API 將輸入的文字與即時轉換為自然聲音它是用來將先進的閱讀功能整合到網站和應用程式中的技術基礎。它能夠根據情緒和上下文調整語音，並擁有出色的多語言支援。的特點是：

代表服務

Google Cloud 文字轉語音
 亞馬遜波莉
 IBM Watson 文字轉語音功能

導入方法

首先，在 Google Cloud、Amazon AWS 或 IBM Watson 等 API 供應商建立帳號，並啟用 API；這可以透過將取得的 API 金鑰納入開發環境，並執行程式、將文字傳送至 API 並播放產生的語音資料來實現。

方法 5：提供視訊和音訊內容。

這是一種在網站上以音訊形式提供資訊的方式，即視訊或音訊內容。結合視覺元素，可從多角度傳達資訊。製作內容需要時間和精力，例如視訊編輯，但這取決於編輯、以容易理解的方式傳達訊息的最可靠方法。也可以是

導入方法

首先，使用錄音軟體或視訊編輯工具製作內容；將檔案上傳至伺服器；然後，使用視訊編輯工具製作視訊檔案；然後，將檔案上傳至伺服器；然後，使用視訊編輯工具製作視訊檔案、直接在您的網站上嵌入標籤，或上傳到 YouTube 或 SoundCloud，並取得嵌入代碼，將其嵌入您的網站上還有：提供字幕和轉譯以提高無障礙程度會更好。

所有這些方法都有助於改善使用者的便利性，並確保可達性，但在導入和操作這些方法時，應該以需要注意的幾點和需要解決的問題下一節將介紹現場讀出功能所面臨的挑戰。

5 網頁讀取功能的挑戰。

雖然讀出功能對各種使用者都很有用，但它也帶來了一些挑戰；在此將討論五種典型的挑戰。

問題 1：語音品質和自然度的限制。

近年來，先進合成技術 (例如 AI 語音) 的使用，讓更多自然語音得以產生，但許多常用的瀏覽器閱讀功能和螢幕閱讀器、單調而機械的聲音是。

單調的語音和不自然的語調可能會造成問題，尤其是當使用者追求語音品質時、如果閱讀目標是長篇文字，則容易疲勞。問題在於

問題 2：某些字元和符號無法正確辨識。

某些特殊字符、符號和縮寫字元無法正確讀出。在某些情況下，這個問題不僅讓使用者難以理解內容、造成網站整體可達性降低的原因。也可以是

例如，程式碼、數學公式和化學公式等技術符號可能無法按照原意讀出，使使用者感到困惑，縮寫（例如 NASA 和 HTML）也可能無法正確發音，使使用者難以瞭解其含義。

此外，如果經常使用裝飾符號或表情符號，閱讀引擎可能會讀出所有表情符號的名稱，造成多餘且混亂的結果 (例如：將所有 😊 讀出為 'smiley face emoji')。

問題 (iii) 多語支援的困難。

多語言網站需要適當地切換語言。不正確的發音或不自然的讀音。發生，如果語言代碼 (例如 lang="en"、lang="ja") 未設定正確，語音引擎將無法正常運作。

需要適當設定語言代碼或切換文字轉語音引擎的地方、此應變技術複雜，且會增加作業工時。就點數而言，這是多語言網站的共同挑戰。

問題 4：處理動態內容。

動態內容，例如評論區、聊天和彈出式視窗是非常吸引人和有用的，因為它們可以即時更新資訊、它與現場讀出功能不相容。

在許多情況下，讀出功能和螢幕閱讀器無法辨識即時新增的資訊、沒有讀到最後"、「重疊讀取」等，這些都無法充分向使用者傳達資訊。因此，新資訊可能會被忽略，或者使用者可能會在非預期的時間再次聽到舊資訊。

挑戰 5：無障礙支援的成本與負擔。

為了讓讀出功能正常運作、網站的 HTML 和結構是依照無障礙標準正確撰寫的。是必需的；但在實際情況下，由於 HTML 描述不正確、缺乏替代文字或未設定 ARIA 屬性，很多時候讀出功能無法如預期般運作。

要解決這些問題，需要對網站進行修改，這需要財務成本和時間成本，尤其是對於預算和人力都有限的小型企業而言，這個負擔相當沉重，無障礙支援也因此被擱置一旁。這種情況經常發生。

然而，在實施和操作讀出功能時，這些挑戰是不可避免的、人工智能技術的最新進展也為解決這些問題提供了可能性。下一節將介紹 AI 技術帶來的網站閱讀功能演進。

AI 技術帶來的網站閱讀功能演進。

近年來，人工智慧技術的進步使得網站閱讀功能有了顯著的進步。利用深度學習（從大量資料中自動學習特徵的技術）的語音合成模型。在從文字產生語音時，附加以情感和情境為基礎的語調、產生更自然、類似人聲的聲音，而非傳統機械式的大聲朗讀。。

AI 也是瞭解文字上下文和字詞關係。系統會適當地閱讀內容，例如對新聞文章使用官方語氣，對故事內容則使用感性的語氣。

此外，多語支援也隨著 AI 的發展而演進、Google Cloud TTS 等文字轉語音技術支援數十種語言並允許在不同語言之間流暢切換，例如在混合了英文和日文的頁面上、文字會自動識別，並按每種語言的適當發音和語調大聲朗讀，或在翻譯時以目標語言大聲朗讀文字。這是可以做到的。

這些技術包括整合至現有的閱讀方式，例如瀏覽器、螢幕閱讀器和外掛程式，大幅提升各自的功能並有可能大幅改善使用者體驗。

参考：最新語音合成技術及其應用：人工智能創造的未來語音。 / 2024 年最新消息：文字轉語音科技的演進與驚人的使用案例。（Reinforz Insight）、多語言合成語音不會損失講話者的語音品質 FutureVoice Crayon 語音合成解決方案中採用了跨語言語音合成技術。在日本首次商業化提供此技術。（NTT Technocross）