Notre but est d'évaluer la facilité d'utilisation d'un correcteur d'orthographe. Cela correspond dans notre cas à la facilité avec laquelle un ensemble de tâches peut être accompli par un utilisateur. Pour l'opération de base d'un correcteur, nous considérons que l'ensemble de tâches de départ comprend :
Il est clair que ces tâches peuvent être décomposées en sous-tâches, dont certaines peuvent être facultatives ou non.
Une condition préalable à l'examen des méthodes que nous allons voir est l'élaboration d'une liste des commandes propres à chaque système nécessaires à l'exécution des différentes tâches que nous avons identifiées. Cette liste des correspondances tâches/commandes sera le fondement des mesures de comptage des opérations que nous allons faire, ainsi que d'autres méthodes telles que la description de la facilité d'utilisation.
Nous faisons la distinction entre trois attributs de la facilité d'utilisation qui sont la performance des utilisateurs expérimentés (Experienced User Performance), le degré de ressemblance (Guessability), et la facilité d'apprentissage (Learnability). La distinction n'est ainsi pas centrée sur les concepts de novice ou d'expert, mais plutôt sur le fait qu'il devrait être possible d'exécuter des tâches simples, facilement, mais aussi d'exécuter des tâches plus complexes. Donc, il s'agit de voir comment le système permet à l'utilisateur d'évoluer.
D'emblée, nous pouvons supposer que dans le cas des utilisateurs expérimentés, nous chercherons à mesurer la facilité d'utilisation potentielle du système, c'est-à-dire le niveau de performance auquel la courbe d'apprentissage se stabilise pour atteindre un maximum. Cela vaudra pour toutes les fonctions de l'interface.
Il n'est pas clair si l'utilisation de manuels est vraiment appropriée à l'apprentissage des correcteurs orthographiques. Cet apprentissage est surtout fondé sur le degré de ressemblance, qui est distinct de l'intuition à proprement parler. Le degré de ressemblance repose largement sur les similitudes de l'interface ou des opérations d'un système avec ceux d'autres progiciels. Ainsi, un utilisateur de Macintosh pourra plus facilement deviner comment utiliser un nouveau progamme qui comprend une interface qui ressemble au standard Macintosh. Plus généralement, toute expérience antérieure, toute compétence de l'utilisateur augmente sa capacité de deviner. Le degré de ressemblance est aussi dépendant du nombre d'options offertes : un système avec un grand nombre de fonctions pourra avoir un degré de ressemblance plus faible (et aussi peut-être un EUP plus faible) qu'un système plus simple, qui est plus adapté aux besoins spécifiques de l'utilisateur.
La facilité d'apprentissage décrit la nature de la courbe d'apprentissage par laquelle les utilisateurs novices pourront s'approcher du rendement maximum de l'EUP. Une des critiques des interfaces ``intuitives'' concerne la difficulté de dépasser le stade intuitif : l'utilisateur a peu de possibilités d'apprendre à faire les choses d'une manière plus rapide et plus efficace, car il s'en tient souvent aux fonctions qu'il connaıt intuitivement. La facilité d'utilisation des manuels et de l'aide interactive est un des facteurs dans ce cas, de même que le nombre d'options offertes (un trop grand nombre d'options risque d'avoir pour effet de décourager l'utilisateur d'aller plus loin afin de trouver la manière optimale d'effectuer ses opérations).
Il sera attribué une mesure à chaque sous-tâche du processus de vérification dans les sections qui suivent. Dans notre optique des aspects de la facilité d'utilisation, nous sommes portés à poser trois questions pour chaque tâche ou sous-tâche :
Il s'agit ici des opérations ou commandes qui sont disponibles pour accomplir une tâche. En général, ce sera une mesure basée sur les faits, le plus souvent choisie à partir d'une liste qui sera déterminée à l'avance selon notre expérience avec le genre de système utilisé pour les tests.
Nous préférons adopter une mesure liée à l'EUP, simple et facile à obtenir pour chaque sous-tâche : le nombre minimum de frappes ou de manipulations de la souris requises pour accomplir cette tâche. Nous appelerons cela une mesure de comptage des opérations. Ce que cette mesure peut sembler perdre en validité, elle le gagne en clarté et aisance de traitement. Il est certain que bien d'autres facteurs influencent le rendement maximum.
Il pourra se révéler difficile de concevoir des méthodes pratiques pour tester cet attribut. De plus, fournir une valeur pour chaque commande ne sera pas nécessairement très utile à l'utilisateur en ce qui concerne le degré de ressemblance du système.
Nous allons présenter pour chaque tâche une seule mesure de degré de ressemblance ainsi que d'apprentissage. Le degré de ressemblance ne concernera que l'interface, alors que la facilité d'apprentissage comptera aussi les effets des manuels ou de l'aide interactive en ce qui concerne la transition d'utilisateur novice à utilisateur expérimenté. Les deux mesures feront appel à une échelle de mesure, et dans le cas de la facilité d'apprentissage, une valeur de similarité se rapportant à la ressemblance avec des interfaces ou styles qu'un utilisateur pourrait éventuellement connaıtre. De plus, ce genre d'attribut exigera sûrement un commentaire concis sur les problèmes ou avantages éventuels.
De quelle manière le logiciel est-il lancé ? Il s'agit principalement de savoir si le logiciel fonctionne à partir d'un autre programme (traitement de texte) ou si c'est un programme autonome.
La deuxième étape concerne la sélection du texte à vérifier.
Une des conclusions des études antérieures a été qu'une grande partie des utilisateurs a besoin que la bonne suggestion occupe la première place dans la liste, car tout moyen accéléré de remplacement (par exemple, au moyen d'un seul clique) ne s'applique qu'à la première suggestion, ce qui implique plus d'opérations pour l'acceptation de suggestions situées plus bas dans la liste.
Les mesures que nous allons utiliser ici sont légèrement plus complexes puisque le dialogue avec l'utilisateur comprend plusieurs choix, qui ne sont pas nécessairement tous présents dans chaque cas. Parmi les options, on compte les suivantes :
Chacune de ces actions peut être analysée du point de vue de sa facilité d'exécution. Il est intéressant de noter que l'importance de chaque opération pourra varier en fonction de la performance du correcteur en ce qui concerne la couverture et les suggestions de remplacement. Si, pour une raison de rédacteur, de texte ou de logiciel, le taux de faux positifs est élevé, il sera particulièrement important que les deux premières options soient faciles. Si les suggestions sont généralement mal organisées, il sera important que les suggestions autres que la première soient aussi faciles à choisir que celle-ci. Cependant, dans la plupart des cas, nous privilégierons la mesure pour l'option d'accepter la première suggestion et celle de rejeter les autres.
Il peut encore y avoir des correcteurs pour lesquels la tâche de convertir la décision de l'utilisateur en une modification du texte est encore assez difficile ; c'est certainement le cas des vérificateurs de grammaire et de style. Nous considérons aussi dans cette section qu'il peut être souhaitable de conserver une trace des changements proposés et effectués, même si normalement ce n'est pas exigé d'un correcteur. Toutefois cette option peut se révéler intéressante pour certains types d'utilisateurs, dont ceux qui rédigent des articles à plusieurs auteurs.
Notre mesure du degré de ressemblance s'appliquera à chaque ensemble de tâches cohérent dans son ensemble. Ainsi, nous avons une mesure pour la vérification de base et une autre pour la personnalisation. Nous proposons une mesure avec des valeurs de 1 à 5 sur une échelle de mesure, puis une seconde partie rédigée, détaillant les problèmes spécifiques que pourraient rencontrer certains utilisateurs.
Nous supposons que l'évaluation des manuels fait partie de l'évaluation de la facilité d'apprentissage du correcteur. Nous voulons prendre en compte toute documentation qui puisse augmenter les connaissances de l'utilisateur.
Pour chaque source de documentation nous avons des mesures d'évaluation :