Skip to content Skip to sidebar Skip to footer

ChatGPT élimine-t-il le besoin d’interfaces visuelles (et de conception UX) ?

ChatGPG introduit une UX conversationnelle efficace qui pourrait surpasser les interfaces visuelles pour des tâches spécifiques.

ChatGPT et d’autres modèles basés sur de grands langages sont désormais « la grande chose » et promettent de révolutionner la plupart des activités que nous faisons chaque jour numériquement. En tant que professionnels de l’UX, cependant, nous nous concentrons sur les utilisateurs et nous pensons que toute innovation doit apporter de la valeur et résoudre les problèmes des utilisateurs visés. Ce concept de « valeur » est essentiel pour déterminer l’utilité et l’innovation d’un produit ou d’une technologie.

Dans les dernières nouvelles de l’industrie UX, il y a eu une tendance à utiliser ChatGPT pour des tâches telles que la génération de contenu pour les maquettes de conception, la recherche d’utilisateurs (!) Et la création de textes convaincants. Bien que ces avancées puissent améliorer l’expérience et la productivité des concepteurs, notre principale préoccupation reste les utilisateurs eux-mêmes. Nous voulons nous assurer que toute implémentation de ChatGPT ou de technologies similaires améliore réellement l’expérience utilisateur et les rapproche de la valeur qu’ils recherchent.

Dans le livre « Innovare con il Design: Il Caso del Settore dell’Illuminazione in Italia » (F. Zurlo et al., Paper, 2002), « l’innovation » (dans un produit, un artefact ou une interface, …) est définie comme un différence positive par rapport aux produits similaires existants. Ce delta est basé principalement sur la résolution des problèmes des utilisateurs. On pourrait dire que cet attribut d’utilité est une condition fondamentale pour définir qu’un produit, une fonctionnalité, une technologie, est innovant. Évidemment, il existe de nombreuses innovations dans le domaine de la recherche pure qui n’ont pas d’impact immédiat sur les utilisateurs, mais toute recherche menée, à la toute fin de son parcours, est censée résoudre un problème pour quelqu’un. Sinon, à quoi servirait-il ?

Par conséquent, la question primordiale concernant les technologies comme ChatGPT est pour moi :

Comment (et où) ChatGPT, ou des technologies similaires, peuvent-ils améliorer l’expérience utilisateur et introduire une différence positive qui rapproche les utilisateurs de la valeur qu’ils recherchent ?

 

ChatGPT et interfaces


Du point de vue spécifique de l’interface utilisateur, qui intéresse au plus haut point les professionnels de l’expérience utilisateur, la question devient : quels avantages ChatGPT peut-il apporter par rapport aux types d’interface existants ? En quel sens peut-on le définir comme innovant ?

ChatGPT représente un exemple d’interface conversationnelle. Les interfaces conversationnelles « permettent aux gens d’interagir avec des logiciels, des applications et des bots comme ils interagissent avec de vraies personnes. En utilisant le langage naturel pour taper ou parler, ils peuvent accomplir certaines tâches avec facilité. » (extrait de « Qu’est-ce qu’une interface conversationnelle ? » Par Jesse Martin, blog Zendesk).

Ces interfaces existent sous deux formes principales depuis le début des années 2000 :

Chatbots : ils utilisent des réponses et des chemins prédéfinis pour les questions courantes, souvent utilisés dans les scénarios de dépannage et de support client.


Assistants vocaux : ils permettent aux utilisateurs d’interagir avec les interfaces par la parole naturelle, permettant l’exécution de tâches prédéfinies communes. Même avant l’avènement des assistants vocaux populaires comme « Alexa », les premiers téléphones portables comportaient des commandes vocales pour lancer des appels.

Aujourd’hui, cette possibilité d’interaction est intégrée dans les montres intelligentes modernes, les systèmes d’infodivertissement automobiles et les téléviseurs intelligents.
Bien que les applications précédentes des interfaces conversationnelles aient été quelque peu limitées et souvent décevantes pour les utilisateurs, des technologies comme ChatGPT promettent désormais d’élever ce type d’interaction au niveau supérieur. Contrairement aux approches scriptées limitées, ChatGPT peut générer des réponses basées sur la connaissance du domaine, de la même manière qu’une personne réelle répondrait. Avec cette avancée significative dans l’interaction conversationnelle, avons-nous encore besoin d’interfaces visuelles ?

Dans son récent article « AI Is First New UI Paradigm in 60 Years », Jakub Nielsen lui-même définit l’interaction introduite par ChatGPT et des technologies d’IA similaires comme une « spécification de résultat basée sur l’intention », qui représente le modèle d’interaction le plus récent et émergent. Dans ce modèle, l’utilisateur communique le résultat souhaité à l’ordinateur sans préciser les étapes pour y parvenir. Cette approche peut être incroyablement puissante et applicable à l’ensemble du spectre des applications numériques, y compris les clients de messagerie, les services bancaires en ligne, les sites Web informatifs, les logiciels spécialisés basés sur le cloud, les plateformes de réseaux sociaux, les navigateurs Internet et les moteurs de recherche. D’autre part, les interfaces visuelles sont classées comme l’un des types appartenant au deuxième paradigme, le « paradigme d’interaction basé sur les commandes ».

Alors, les interfaces visuelles seront-elles encore nécessaires pour faire fonctionner ces systèmes, ou tout deviendra-t-il « conversationnel » ?

Les interfaces utilisateur servent de support entre les utilisateurs et les machines, et plus une interface est immersive, plus elle devient conviviale. Les interfaces immersives imitent les comportements, les gestes, les modèles d’interaction et les modèles mentaux humains, s’alignant sur la façon dont les humains agissent naturellement et nécessitant peu ou pas d’apprentissage. Ils offrent des expériences immédiates, centrées sur l’utilisateur et intuitives. (Ils sont définis immersifs précisément parce que les utilisateurs ne ressentent aucune interruption pertinente dans la relation avec la machine ; c’est comme faire partie du même environnement, et les utilisateurs se sentent immergés dans le système. Le meilleur exemple d’immersion est, par définition, la réalité virtuelle. , mais ce concept convient pour décrire chaque interface qui semble naturelle et réduit la « distance » que les utilisateurs perçoivent du système).

 

Interfaces et tâches


Si nous y réfléchissons, les interfaces visuelles ont été conçues comme des moyens imparfaits d’imiter l’interaction humaine. Nous pouvons imaginer chaque interface visuelle comme un dialogue idéal entre l’utilisateur et le système. Le système nécessite des entrées spécifiques de la part de l’utilisateur et, en même temps, fournit des conseils et des explications sur ce que sont ces entrées, comment les formater correctement pour que le système comprenne, où elles peuvent être trouvées, à quoi elles seront utilisées et bientôt. Le système fournit ensuite aux utilisateurs les résultats (espérons-le) attendus.

Considérons maintenant trois tâches que les utilisateurs effectuent généralement numériquement :

Ouvrir un compte bancaire :


Cette tâche est complexe et nécessite que les utilisateurs comprennent comment le site Web de la banque est structuré et trouvent le contenu nécessaire pour lancer le processus. Le système nécessite des entrées simples comme le nom, le prénom, etc., mais aussi des informations plus complexes comme les données de la carte d’identité ou d’autres documents à télécharger. Cela peut même nécessiter des entrées extrêmement complexes comme des réponses aux questionnaires FATCA ou KYC qui exigent de l’attention, des connaissances, des documents spécifiques et parfois des recherches détaillées.

Ce n’est pas très différent d’une conversation dans une agence bancaire physique, où un client ou un prospect souhaite ouvrir un compte bancaire et interagit avec un caissier qui connaît les procédures et les informations à fournir. Le résultat précieux (le compte bancaire) est finalement émis.

De nos jours, les professionnels de la conception UX utilisent souvent ce qu’on appelle un «assistant» ou un «chemin guidé» pour décomposer les tâches complexes en tâches plus petites et guider les utilisateurs étape par étape sur les entrées requises. Les assistants sont essentiellement la version numérique du caissier de la succursale demandant des informations et des documents sur les clients dans le bon ordre.

Cependant, imaginez si nous pouvions tirer parti de ChatGPT ou d’une autre interface conversationnelle basée sur l’IA pour cette tâche. Nous pourrions demander en termes clairs ce dont nous avons besoin et laisser le système nous guider.

Les assistants seraient-ils encore l’interface la plus efficace pour ce type de tâche complexe ? Alors qu’une interaction basée sur l’IA (interface conversationnelle) peut parfois mieux fonctionner en tant qu’interface, un assistant bien conçu (interface visuelle) a toujours ses avantages.

Suivi des transactions du compte nouvellement ouvert :


Dans ce deuxième scénario, nous voulons suivre la tendance du solde de notre compte bancaire, combien nous avons économisé, les jours que nous avons dépensés le plus, pourquoi et la tendance générale des dépenses.

ChatGPT fournira-t-il une meilleure interface pour cette tâche ? Probablement pas. Des tâches comme celles-ci, qui nécessitent une comparaison et une compréhension d’une vue d’ensemble, sont mieux résolues avec des interfaces visuelles, des graphiques et des représentations puissantes qui permettent de multiples interprétations.

3. Prendre un bus : obtenir des informations fondamentales :


Imaginons que nous nous préparons pour le travail et que nous voulons connaître l’heure du prochain bus à notre arrêt afin de pouvoir le prendre. Actuellement, nous avons plusieurs façons d’obtenir ces informations, comme consulter les horaires sur le site Web des transports en commun ou utiliser des applications comme Google Maps. Encore une fois, nous pouvons utiliser l’application de transport en commun pour récupérer ces informations.

ChatGPT serait-il plus performant que les interfaces que nous utilisons actuellement ?

Dans ce cas, ChatGPT pourrait offrir beaucoup plus de valeur qu’une interface classique. Il peut fournir une réponse directe à une question spécifique, effectuer la tâche de récupération des informations et fournir un résultat précis.

Conversationnel vs visuel, quand utiliser quoi, quand utiliser les deux


Dans ces trois scénarios, nous avons vu comment différents types de tâches utilisateur peuvent ou non bénéficier d’une interaction conversationnelle comme celle avec Chat GPT et d’autres systèmes d’IA. En essayant de généraliser, on pourrait dire que :

Des tâches telles que la configuration, l’intégration, la configuration et chaque fois que le système nécessite des entrées complexes et structurées difficiles à comprendre et à assimiler, bénéficient de bonnes interfaces conversationnelles.


Cependant, les tâches qui nécessitent l’interprétation de résultats complexes (comme l’observation de graphiques pour repérer les tendances et prendre des décisions, la vérification des e-mails, la surveillance d’un flux de réseau social) ont toujours besoin d’interfaces visuelles avec de bons principes de conception UX.
En fin de compte, les tâches qui nécessitent une sortie précise et limitée, comme connaître l’heure d’arrivée d’un bus, vérifier s’il va pleuvoir demain ou rechercher des informations spécifiques via un moteur de recherche, fonctionnent beaucoup mieux lorsque l’expérience est gérée par ChatGPT, qui peut imiter une personne réelle et rendre le chemin de l’utilisateur vers l’information souhaitée beaucoup plus court.
Si nous considérons la quantité d’entrées et de sorties impliquées dans la résolution d’une tâche, nous pouvons résumer cela comme suit :

Grande quantité d’entrées requises : les interfaces conversationnelles fonctionnent mieux.
Faible quantité d’entrées requises (ou séquence très claire) : les interfaces visuelles fonctionnent mieux.
Grande quantité de sorties générées : les interfaces visuelles fonctionnent mieux.
Faible quantité de sorties générées : les interfaces conversationnelles fonctionnent mieux.

 

Conclusion


Il est encore tôt pour comprendre pleinement le potentiel de ChatGPT et des LLM et il est crucial de se lancer dans l’expérimentation et l’exploration de ces technologies. Espérons que ce bref essai pourra être utile aux professionnels de l’expérience utilisateur et des produits pour déterminer quand et où utiliser efficacement ces technologies pour la conception d’interfaces utilisateur, afin de fournir aux utilisateurs une valeur réelle. Cela devrait aider à comprendre comment combiner ces technologies avec des interfaces visuelles traditionnelles et déterminer quelle approche fonctionne le mieux, en fonction du type de tâches et des entrées requises et des sorties générées.

Pour citer à nouveau J. Nielsen, « les futurs systèmes d’IA auront probablement une interface utilisateur hybride qui combine des éléments d’interfaces basées sur l’intention et sur les commandes tout en conservant de nombreux éléments d’interface graphique ».

Le plus grand défi UX consiste désormais à comprendre comment bien concevoir ces expériences hybrides.

Auteur/autrice

  • Thibault B

    Thibault Bouday est un développeur et expert SEO indépendant qui travaille actuellement pour l'agence Tikéo à Besançon. Son expérience dans le domaine du web lui permet aujourd'hui d'apporter une réelle expertise sur les sujets SEO et édition de site. Passionné par les nouvelles technologies et les stratégies digitales, Thibault excelle dans l'optimisation des performances en ligne et l'amélioration de la visibilité des sites web. Il maîtrise les outils d'analyse tels que Google Analytics, SEMrush et Majestic SEO, et est constamment à l'affût des dernières tendances en matière de référencement.

    Voir toutes les publications

Leave a comment