ユニウェブ

Expliquer cinq méthodes pour réaliser la "synthèse vocale" d'un site web.

2024/11/28

サイト読み上げ

À l'heure actuelle, la conformité à l'accessibilité est exigée pour tous les sites web,« Lecture d'un site web »Les fonctionnalités et outils réalisant cela sont des éléments indispensables à l'amélioration de l'accessibilité et de l'expérience utilisateur.

La fonction de lecture des sites aide non seulement les utilisateurs divers, y compris les personnes malvoyantes, à accéder à l'information sur le web de manière équitable, mais elle est également reconnue comme un outil soutenant le multitâche.

Il existe cinq méthodes représentatives pour la synthèse vocale des sites web.

Méthode ① Utiliser la fonction de lecture du navigateur
Méthode ② Utiliser un lecteur d'écran
Méthode ③ Intégration de plugins
Méthode ④ Utiliser l'API de synthèse vocale
Méthode ⑤ Fournir du contenu vidéo ou audio

Cet article présente cinq méthodes de synthèse vocale représentatives, décrivant leurs caractéristiques, leurs méthodes d'implémentation, ainsi que les défis que rencontrent ces fonctions vocale.

Cinq manières de lire un site web

Tout d'abord, nous allons présenter cinq méthodes pour effectuer la lecture d'un site web. Le tableau ci-dessous résume chaque méthode en comparaison.

◆ Tableau comparatif des cinq méthodes de synthèse vocale pour les sites web

méthode Caractéristiques Champ d'application Avantages Inconvénients
① Utiliser les fonctionnalités de lecture du navigateur Intégré en tant que fonctionnalité standard dans les navigateurs web et disponible via les paramètres. Tout le navigateur Pas de coût d'implémentationDisponible sur
• Peut être facilement activé à partir des paramètres du navigateur, permettant aux utilisateurs de l'utiliser immédiatement.
・ Souvent lu par une voix monotone.
Peut être utilisé uniquement sur certains navigateurs ou systèmes d'exploitation.
② Utiliser un lecteur d'écran Technologie d'assistance principalement conçue pour les personnes malvoyantes, outil disponible sur l'ensemble des systèmes d'exploitation et des applications. À l'échelle du système ou de l'application en général • Soutien général à l'accessibilitéDisponible à l'échelle du système.
・ Il existe également des options compatibles avec la sortie en braille.
・ Des réglages et une installation sont nécessaires, ce qui peut sembler encombrant pour les personnes valides.
Il existe également des outils payants.
③ Intégration de plugins En intégrant des scripts ou autres codes sur le site, lire des contenus spécifiques. Sites web ou pages spécifiques Forma optimisée pour certains contenus.fonctionne via
• Personnalisation possible
Sont laborieuses à implémenter.
・ La portée des fonctionnalités dépend des plugins installés.
Méthode ④ Utiliser l'API de synthèse vocale Capable de générer une voix de haute qualité et plus naturelle, utilisable dans toutes les situations nécessitant une voix. Des sites web et applications aux dispositifs IoT, création de contenu et chatbots, divers domaines sont couverts. • Personnalisation avancée etGénération de voix naturelle possible.
• Excellente prise en charge multilingue
• Technique et élevées exigences d'implémentation pour les développeurs
Les coûts d'exploitation peuvent être élevés.
⑤ Fourniture de contenu vidéo et audio Fournir des informations sous forme de voix ou de contenu vidéo. Limité à certains contenus (audio et vidéo) • Pas seulement la voix, mais aussiUtiliser des éléments visuels et de la musique.peut faire
・ possibilité de se concentrer sur du contenu spécifique
Créer du contenu demande des efforts.
・ Manque de réactivité en temps réel.

Principalement, la synthèse vocale des sites web est réalisée de cette manière. Les points ③, ④ et ⑤ peuvent fournir une synthèse vocale précise, maisDévelopper et produire du côté des exploitants du site web.Nécessaire.

D'autre part, concernant ① et ②, il n'est pas nécessaire de réaliser un développement spécial côté site web car la lecture est effectuée par les paramètres des navigateurs et les outils utilisés par l'utilisateur, mais pour que les fonctionnalités de lecture des navigateurs et les lecteurs d'écran fonctionnent correctement,La structure du site et la manière dont le HTML est écrit sont conformes aux normes d'accessibilité telles que les WCAG.Nécessaire.

Nous détaillerons ci-dessous les méthodes d'implémentation de chaque méthode.

Méthode ① Utiliser la fonction de lecture du navigateur

Utilise les fonctionnalités de lecture intégrées aux navigateurs web comme « Google Chrome » ou « Safari ». Sans avoir besoin d'installer des applications ou des logiciels spéciaux.Il est disponible et permet aux utilisateurs de simplement configurer pour convertir le texte en voix et le fournir. Il est utile non seulement pour les personnes malvoyantes, mais également pour les personnes valides qui souhaitent obtenir des informations en multitâche.

Cependant, cela ne fonctionne que sur des navigateurs.Ce n'est pas quelque chose qui fonctionne dans l'ensemble du système comme un lecteur d'écran, donc sa fonctionnalité est limitée pour les personnes malvoyantes.peut être dit.

◆ Services représentatifs

Microsoft Edge
Safari(Mac)
Google Chrome

Méthodes d'intégration

Activez la fonction de synthèse vocale depuis le menu des paramètres de chaque navigateur. Si vous utilisez une extension ajoutée dans le navigateur, après avoir installé l'extension sur le navigateur, activez la fonctionnalité. Par exemple, dans Chrome,« Lire à voix haute »Des extensions telles que celles-ci sont également disponibles.

Méthode ② Utiliser un lecteur d'écran

Un lecteur d'écran est une technologie d'assistance conçue pour les personnes malvoyantes, qui convertit les informations à l'écran en audio ou en braille. Cela s'applique aux navigateurs web et au-delà.Peut être utilisé à l'échelle du système, y compris les systèmes d'exploitation et les applications.Caractérisé par.

◆ Outils représentatifs

NVDA Version japonaise
Narrateur
PC-Talker
JAWS 2024 Version japonaise
ZoomText 2024 Version japonaise

Méthodes d'intégration

La méthode d'implémentation varie selon les outils, mais généralement, il est nécessaire de les télécharger à partir de leur site officiel ou de les installer après achat de la licence. De plus,Les smartphones sont équipés de lecteurs d'écran par défaut.Pour iOS, depuis le menu d'accessibilité des paramètres.« VoiceOver »Pour l'activer, sur Android,« TalkBack »L'activation de cette fonction permet d'activer la fonctionnalité de lecture.

Concernant les lecteurs d'écran,Pour plus de détails, voir l'article ci-dessous, et n'hésitez pas à le consulter avec cet article.

Articles connexes :Explication de l'utilisation des lecteurs d'écran et des cinq outils représentatifs

Méthode ③ Intégration de plugins

Les plugins permettent d'ajouter facilement des fonctions de synthèse vocale à un site web.Fournit des fonctionnalités de lecture spécialisées pour du contenu spécifique (par exemple : descriptions de produits, articles, FAQ, etc.).Ainsi, les opérateurs peuvent personnaliser les fonctions de manière flexible en fonction des objectifs du site. De plus, en personnalisant les paramètres, par exemple,Une interface intuitive et facile à utiliser, permettant de spécifier la zone à lire et d'installer des boutons de démarrage et d'arrêt du son.Peut également être offert aux utilisateurs.

◆ Plugins représentatifs

Uniweb
ReadSpeaker
BrowseAloud

Méthodes d'intégration

Comme méthode d'intégration courante, il s'agit de sélectionner le plugin approprié sur le site de service,Cela peut être réalisé simplement en insérant le code du script du fournisseur dans l'en-tête HTML.Il est possible de personnaliser la plage de texte et le design des boutons dans l'interface de gestion.

Méthode ④ Utiliser l'API de synthèse vocale

L'API de synthèse vocale convertit le texte entré enTransformé en voix naturelle en temps réel.En tant que base technologique, cela est utilisé pour intégrer des fonctions de lecture avancées dans des sites web ou des applications.Il est possible d'ajuster la voix en fonction de l'émotion ou du contexte et elle est également excellente pour plusieurs langues.Caractérisé par.

◆ Services représentatifs

Google Cloud Text-to-Speech
Amazon Polly
IBM Watson Text-to-Speech

Méthodes d'intégration

Tout d'abord, créez un compte avec des fournisseurs d'API tels que Google Cloud, Amazon AWS, IBM Watson et activez l'API. Intégrez la clé API obtenue dans l'environnement de développement, implémentez le programme, puis envoyez du texte à l'API pour reproduire les données vocales générées.

Méthode ⑤ Fournir du contenu vidéo ou audio

Une méthode pour fournir des informations sur le site par voix, sous forme de vidéos ou de contenus audio.En combinant des éléments visuels, il est possible de transmettre l'information sous plusieurs angles.La création de contenu, comme le montage vidéo, demande du temps et des efforts, mais avec un bon montage,Le moyen le plus sûr de communiquer clairement le contenu que vous souhaitez transmettre.Cela peut également être le cas.

Méthodes d'intégration

Tout d'abord, créez le contenu à l'aide de logiciels d'enregistrement audio ou d'outils de montage vidéo. Téléchargez le fichier sur le serveur.Méthode pour intégrer des balises directement dans le site web ou pour télécharger sur YouTube ou SoundCloud, puis obtenir le code d'intégration et l'incorporer dans le site.Il serait encore mieux de renforcer l'accessibilité en fournissant des sous-titres et des transcriptions.

Chacune de ces méthodes aide à améliorer la commodité pour les utilisateurs et à garantir l'accessibilité, mais lors de leur mise en œuvre ou de leur opération, il fautCertaines remarques et défisils existent. Passons maintenant à la discussion des défis liés à la fonction de lecture du site.

Cinq défis des fonctionnalités de lecture des sites web.

La fonctionnalité de lecture est utile pour divers utilisateurs, mais elle présente également plusieurs défis. Nous allons discuter des cinq défis majeurs ici.

Défi ① Les limites de la qualité et de la naturalité de la voix

Ces dernières années, l'utilisation de technologies de synthèse avancées comme la voix IA a permis de générer une voix plus naturelle, cependant, de nombreuses fonctions de synthèse vocale sur les navigateurs courants et les lecteurs d'écran,Voix monotone et mécaniqueC'est.

Lorsque les utilisateurs recherchent une qualité sonore, des voix monotones ou une intonation peu naturelle peuvent poser problème, surtoutL'écoute de textes longs peut entraîner de la fatigue.Il existe un problème comme celui-ci.

Défi ② Certains caractères ou symboles ne sont pas correctement reconnus.

Certaines caractères spéciaux, symboles ou abréviations ne sont pas lus correctement.Cela peut arriver. Ce problème rend non seulement le contenu difficile à comprendre pour les utilisateurs, mais aussi,Causes de la baisse de l'accessibilité de l'ensemble du siteCela peut également être le cas.

Par exemple, dans le cas de notations spécialisées comme des codes de programme, équations ou formules chimiques, la synthèse vocale peut ne pas se faire comme prévu, provoquant de la confusion chez l'utilisateur. De plus, les acronymes (comme NASA ou HTML) peuvent être prononcés incorrectement, rendant leur signification difficile à comprendre pour l'utilisateur.

De plus, lorsque des symboles décoratifs ou des emoji sont souvent utilisés, le moteur de synthèse vocale peut lire tous les noms d'emoji, ce qui peut entraîner des résultats redondants et difficilement compréhensibles. (Par exemple, lire 😊 comme 'emoji sourire')

Défi ③ Difficulté de la prise en charge multilingue

Sur les sites web multilingues, un changement de langue approprié est nécessaire sans quoiPrononciation incorrecte ou lecture peu naturelleCela peut se produire. De plus, si les paramètres de code langue (lang="en", lang="ja", etc.) sont insuffisants, le moteur vocal ne fonctionnera pas correctement.

Les parties nécessitant la bonne configuration du code de langue et le changement de moteur de synthèse vocale,La gestion devient techniquement complexe et augmente la charge opérationnelle.est un problème commun sur les sites multilingues.

Défi ④ Gestion des contenus dynamiques.

Contenus dynamiques comme les sections de commentaires, les chats, les pop-upsEn raison de sa capacité à mettre à jour les informations en temps réel, il est extrêmement efficace et utile, maisLa compatibilité avec les fonctions de synthèse vocale des sites n'est pas bonne.

Dans de nombreux cas, les fonctions de synthèse vocale et les lecteurs d'écran ne reconnaissent pas les informations ajoutées en temps réel.Ne peut pas transmettre correctement les informations aux utilisateurs, comme "ne pas tout lire jusqu'à la fin" ou "lecture qui se chevauche".Il existe un défi à cela. En conséquence, de nouvelles informations peuvent être ignorées ou les utilisateurs peuvent entendre à nouveau de vieilles informations à des moments non désirés.

Défi ⑤ Coût et charge de la conformité à l'accessibilité

Pour que la fonction de synthèse vocale fonctionne correctement,Il est important que le HTML et la structure du site soient correctement décrits conformément aux normes d'accessibilité.Est nécessaire. Cependant, en pratique, il y a souvent des cas où la fonction de lecture ne fonctionne pas comme prévu en raison d'une écriture HTML incorrecte, d'un manque de texte alternatif ou d'attributs ARIA non configurés.

Pour résoudre ce type de problème, une révision du site web est nécessaire, mais cela nécessiteCoûts financiers et tempspeut être nécessaire. En particulier,Pour les petites entreprises ayant des contraintes budgétaires et de personnel, ce fardeau peut être important, et l'accessibilité peut être mise de côté.Ce qui est souvent la réalité.

Ces défis sont inévitables lors de l'implémentation et de l'exploitation des fonctions de lecture. Cependant,Avec l'évolution de la technologie IA ces dernières années, il existe des possibilités d'éradiquer ces défis.Nous allons maintenant discuter de l'évolution des fonctionnalités de lecture des sites grâce aux avancées en intelligence artificielle.

L'évolution de la fonction de lecture des sites grâce aux technologies d'IA.

Ces dernières années, grâce aux avancées des technologies d'IA, les fonctionnalités de lecture des sites ont fait des progrès spectaculaires.Modèle de synthèse vocale utilisant l'apprentissage profond (une technologie qui apprend automatiquement des caractéristiques à partir de vastes ensembles de données).Cela permet de générer de la voix à partir de texte en ajoutant une intonation basée sur les émotions et le contexte.Au lieu d'une lecture mécanique traditionnelle, elle génère une voix plus naturelle et humaine.

De plus, l'IAComprendre le contexte du texte et les relations entre les mots.Par exemple, en utilisant un ton formel pour les articles de nouvelles et une voix riche en émotions pour les contenus narratifs, rendant la lecture adaptée au contenu.

De plus, la prise en charge multilingue a également évolué grâce à l'IA.Des technologies de synthèse vocale comme Google Cloud TTS prennent en charge plusieurs dizaines de langues.Et permettre une transition fluide entre différentes langues. Par exemple, sur une page mélangeant l'anglais et le japonais,Le texte peut être automatiquement reconnu et lu avec la prononciation et l'intonation adaptées à chaque langue, ou traduit tout en étant lu dans la langue cible.Cela rend possible.

De telles technologies sontEn intégrant dans les méthodes de lecture existantes comme les navigateurs, les lecteurs d'écran et les plugins, chaque fonction peut être considérablement renforcée.Cela a le potentiel d'améliorer considérablement l'expérience utilisateur.

Référence :Les dernières technologies de synthèse vocale et leurs applications : La voix du futur créée par l'IA. / Dernières nouvelles 2024 ! Évolution des technologies de synthèse vocale et exemples d'applications étonnantes.Reinforz Insight)、Réalisant une synthèse vocale multilingue sans altérer la qualité de la voix, la solution de synthèse vocale "FutureVoice Crayon" intègre une technologie de synthèse vocale interlangue. Début de la première offre commerciale au Japon.NTT TechnoCross

Un support efficace pour la lecture de sites réalisable avec Uniweb.

Cet article présente diverses méthodes de lecture des sites web, mais celles proposées par notre entrepriseOutil d'accessibilité "UniWeb"est un puissant outil pour réaliser l'accessibilité des sites web dans un court délai.

En raison des outils de plugins,Il suffit d'insérer une ligne de balise dans le site web.Cela permet d'intégrer facilement des fonctionnalités concrètes d'amélioration de l'accessibilité, telles que la fonction de lecture vocale, l'ajustement des couleurs et le changement de la taille de la police.

La fonction de lecture des sites de Uniweb comprendEn plus de la fonctionnalité générale de « lecteur d'écran », il existe également une fonctionnalité de « lecteur partiel ».Ci-dessous, il s'agit de la fonction de lecteur partiel, mais elle peut être activée en un clic et la vitesse de lecture peut également être ajustée.

En cliquant sur la partie que vous souhaitez entendre, elle sera lue spécifiquement, ce qui est utile non seulement pour l'accessibilité, mais aussi pour l'acquisition d'informations en multitâche.

◆ « Lecteur partiel » de Uniweb

ユニウェブの部分リーダー

ユニウェブの部分リーダー2

En général, pour s'assurer que la fonction de synthèse vocale d'un site fonctionne correctement, il est nécessaire de vérifier les problèmes page par page à l'aide d'un lecteur d'écran et de modifier manuellement le HTML ou la structure. Cependant, avec UniWeb,Il est possible d'analyser automatiquement l'ensemble du site pour identifier les problèmes et optimiser la structure de manière efficace.C'est.

UniWeb est un outil fiable et rentable pour la conformité à l'accessibilité web, y compris la synthèse vocale.L'icône rose en bas à droite de cet articleSi vous cliquez ici, le menu d'accessibilité d'UniWeb s'affichera, n'hésitez pas à essayer la fonctionnalité.

Résumé

La fonction de lecture des sites web estJoue un rôle important dans l'amélioration de l'expérience utilisateur et de la conformité à l'accessibilitéCet article présente les caractéristiques et les méthodes d'implémentation des cinq méthodes de lecture, mais lorsque vous envisagez la fonctionnalité de lecture à l'avenir,Choisissez des méthodes adaptées à l'objectif du site et à son public, tout en tenant compte des défis.

De plus, pour se conformer aux fonctionnalités des navigateurs et aux lecteurs d'écran,Rendre la structure du site et l'écriture HTML conformes aux normes d'accessibilité.Il est important de le faire. Cela permet à la fonction de synthèse vocale de fonctionner correctement et de fournir un environnement agréable pour tous les utilisateurs afin d'accéder au contenu.

Actuellement, alors que tous les sites web doivent être conformes à l'accessibilité, les fonctions de synthèse vocale pour permettre aux utilisateurs malvoyants ou âgés d'accéder sans difficulté aux sites devraient devenir de plus en plus importantes.

Si vous visez une accessibilité efficace et efficace, l'utilisation de solutions comme Uniweb pourrait être une option à envisager.

Commencez par une simple demande d'information

Cette section présente les fonctions d'UniWeb et le processus d'introduction.

Demander des documents.