精华内容
下载资源
问答
  • 系统可用性量表
    千次阅读
    2012-05-31 17:22:54

    简要说一下,SUS共10个题,采用李克特5分量表法,其中1,3,5,7,9为正向题,2,4,6,8,10为反向题,在计分的时候大家要注意一下。

    SUS(Syestem Usability Scale)用来测量系统的可用性,百分制来计算的分数,超过60分被认为是good usability。SUS可用来测量某个网站或者产品的可用性,尤其在竞争对手分析(competitive analysis)的时候,SUS的最终数据的差异和实际使用中用户感受到的差异是很一致的。这也说明SUS具有很高的效度。

    Q1. 我会愿意经常使用(登陆/访问)这个产品/网站

    Q2. 我认为这个产品/网站没有必要这么复杂

    Q3. 我认为这个产品/网站很容易使用

    Q4. 我觉得需要有经验的人来帮助我才能使用这一产品/网站

    Q5. 我觉得这个产品/网站的多种功能整合的很好

    Q6. 我觉得这个产品/网站有太多不一致

    Q7. 我觉得大多数人都可以很快学会使用这一产品/网站

    Q8. 我觉得这个产品/网站使用起来很可麻烦

    Q9. 在使用过程中,我感觉很自信

    Q10. 为了操作这个产品/网站,我需要学习很多东西

    评分标准

    SUS的评分为0~100。在计算评分之前,要先计算每一项的基值(contribution),基值的范围在0~4之间。

    1,3,5,7,9题的基值为“得分-1”

    2,4,6,8,10题的基值为“5-得分”计分

    最后所有题目得分总合再乘以2.5为最后评分。评分在60分以上的系统一般被认为是可用性较好的产品。

    更多相关内容
  • 系统可用性量表评估问卷

    千次阅读 2018-06-21 09:21:12
    1,中文:可用性问卷 2,英文原版: sus Measuring Usability With The System Usability Scale (SUS) The System Usability Scale (SUS) was originally created as a “quick and dirty” scale for ...

    1,中文:可用性问卷

    2,英文原版: sus

    Measuring Usability With The System Usability Scale (SUS)

     

    5

    The System Usability Scale (SUS) was originally created as a “quick and dirty” scale for administering after usability tests on systems like VT100 Terminal (“Green-Screen”) applications.

    SUS is technology independent and has since been tested on hardware, consumer software, websites, cell-phones, IVRs and even the yellow-pages.

    The System Usability Scale

    The SUS is a 10 item questionnaire with 5 response options.

    1. I think that I would like to use this system frequently.
    2. I found the system unnecessarily complex.
    3. I thought the system was easy to use.
    4. I think that I would need the support of a technical person to be able to use this system.
    5. I found the various functions in this system were well integrated.
    6. I thought there was too much inconsistency in this system.
    7. I would imagine that most people would learn to use this system very quickly.
    8. I found the system very cumbersome to use.
    9. I felt very confident using the system.
    10. I needed to learn a lot of things before I could get going with this system.

    The SUS uses the following response format:

    Response scale for the SUS

    Scoring SUS

    • For odd items: subtract one from the user response.
    • For even-numbered items: subtract the user responses from 5
    • This scales all values from 0 to 4 (with four being the most positive response).
    • Add up the converted responses for each user and multiply that total by 2.5. This converts the range of possible values from 0 to 100 instead of from 0 to 40.

    Interpreting SUS scores

    Despite the wide usage of SUS, there has been little guidance on interpreting SUS scores, acceptable modifications to the items and information on reliability and validity.

    Over the years I’ve used SUS a lot in my own research and during usability evaluations. During this time I’ve reviewed the existing research on SUS and analyzed data from over 5000 users across 500 different evaluations.

    This data shows that SUS is a reliable and valid measure of perceived usability. It performs as well or better than commercial questionnaires and home-grown internal questionnaires.

    I’ve put these findings in a 150 page detailed report which contains valuable insights on background, benchmarks and best practices for anyone using the SUS. Here are a few highlights.

    What is a good SUS score?

    The average SUS score from all 500 studies is a 68. A SUS score above a 68 would be considered above average and anything below 68 is below average.

    The best way to interpret your score is to convert it to a percentile rank through a process called normalizing. I’ve created a calculator and guide which takes raw SUS scores and generates percentile ranks and letter-grades (from A+ to F) for eight different application types.

    The graph below shows how the percentile ranks associate with SUS scores and letter grades.

    Graph showing how the percentile ranks associate with SUS scores and letter grades

    This process is similar to grading on a curve based on the distribution of all scores. For example, a raw SUS score of a 74 converts to a percentile rank of 70%. A SUS score of 74 has higher perceived usability than 70% of all products tested. It can be interpreted as a grade of a B-.

    You’d need to score above an 80.3 to get an A (the top 10% of scores). This is also the point where users are more likely to be recommending the product to a friend. Scoring at the mean score of 68 gets you a C and anything below a 51 is an F (putting you in the bottom 15%).

    SUS scores are not percentages

    Even though a SUS score can range from 0 to 100, it isn’t a percentage. While it is technically correct that a SUS score of 70 out of 100 represents 70% of the possible maximum score, it suggests the score is at the 70th percentile. A score at this level would mean the application tested is above average. In fact, a score of 70 is closer to the average SUS score of 68. It is actually more appropriate to call it 50%.

    When communicating SUS scores to stakeholders, and especially those who are unfamiliar with SUS, it’s best to convert the original SUS score into a percentile so a 70% really means above average.

    SUS measures usability and learnability

    While SUS was only intended to measure perceived ease-of-use (a single dimension), recent researchshows that it provides a global measure of system satisfaction and sub-scales of usability and learnability. Items 4 and 10 provide the learnability dimension and the other 8 items provide the usability dimension. This means you can track and report on both subscales and the global SUS score.

    SUS is reliable

    Reliability refers to how consistently users respond to the items (the repeatability of the responses). SUS has been shown to be more reliable and detect differences at smaller sample sizes than home-grown questionnaires and other commercially available ones.

    Sample size and reliability are unrelated, so SUS can be used on very small sample sizes (as few as two users) and still generate reliable results. However, small sample sizes generate imprecise estimates of the unknown user-population SUS score. You should compute a confidence interval around your sample SUS score to understand the variability in your estimate.

    SUS is valid

    Validity refers to how well something can measure what it is intended to measure. In this case that’s perceived usability. SUS has been shown to effectively distinguish between unusable and usable systems as well as or better than proprietary questionnaires. SUS also correlates highly with other questionnaire-based measurements of usability (called concurrent validity).

    SUS is not diagnostic

    SUS was not intended to diagnose usability problems. In its original use, SUS was administered after a usability test where all user-sessions were recorded on videotape (VHS and Betamax). Low SUS scores indicated to the researchers that they needed to review the tape and identify problems encountered with the interface. SUS can be used outside of a usability test for benchmarking, however, the results won’t shed much light on why users are responding the way they are.

    There is a modest correlation between SUS and task-performance

    Users may encounter problems (even severe problems) with an application and provide SUS scores which seem high. Post-test SUS scores do correlate with task performance, although the correlation is modest (around r= .24 for completion rates and time), which means that only around 6% of the SUS scores are explained by what happens in the usability test. This is the same level of correlation foundwith other post-test questionnaires.

    Quick' and not so dirty

    At only 10 items, SUS may be quick to administer and score, but data from over 5000 users and almost 500 different studies suggests that SUS is far from dirty. Its versatility, brevity and wide-usage means that despite inevitable changes in technology, we can probably count on SUS being around for at least another 30 years.

    Want to dive deeper?

    Jeff is presenting a seminar on Measuring the User Experience in London on June 15th 2016. This is a half-day workshop for researchers and designers who want to use numbers to inform design and make better decisions about websites, software or mobile apps. Sign up here.

    3 https://www.usability.gov/how-to-and-tools/methods/system-usability-scale.html

     

    Using SUS


    The SU scale is generally used after the respondent has had an opportunity to use the
    system being evaluated, but before any debriefing or discussion takes place. Respondents
    should be asked to record their immediate response to each item, rather than thinking about
    items for a long time.
    All items should be checked. If a respondent feels that they cannot respond to a particular
    item, they should mark the centre point of the scale.

    Scoring SUS


    SUS yields a single number representing a composite measure of the overall usability of the
    system being studied. Note that scores for individual items are not meaningful on their own.
    To calculate the SUS score, first sum the score contributions from each item. Each item's
    score contribution will range from 0 to 4. For items 1,3,5,7,and 9 the score contribution is the
    scale position minus 1. For items 2,4,6,8 and 10, the contribution is 5 minus the scale position.
    Multiply the sum of the scores by 2.5 to obtain the overall value of SU.
    SUS scores have a range of 0 to 100.
    The following section gives an example of a scored SU scale
     

     

    展开全文
  • SUS系统可用性量表

    2022-06-26 15:32:28
    SUS系统可用性量表

    来源:http://www.lanlanwork.com/blog/m/?post=8275

    10个问题,每题10分,满分100分。

    1. 我认为我会愿意经常使用本应用。
    2. 我发现这个应用没必要这么复杂。
    3. 我认为这个应用用起来很容易。
    4. 我认为我需要专业的技术人员支持才能使用该应用。
    5. 我发现这个应用中不同功能较好地整合在一起。
    6. 我认为这个应用存在太多不一致之处。
    7. 我认为大多数人会很快学会使用这个应用。
    8. 我认为这个引用使用起来非常麻烦。
    9. 我对使用这个应用,感到非常自信。
      10.使用这个应用前,我需要学习很多东西。

    在这里插入图片描述
    一个重要的评级,没话写的时候可以凑数。【Bangor, A., Kortum, P., & Miller, J. (2009). Determining what individual SUS scores mean: Adding an adjective rating scale. Journal of usability studies, 4(3), 114-123.】
    在这里插入图片描述

    展开全文
  • 可用性量表很多(见下图),SUS只是其中一个。  SUS简介: 量表作者:John Brooke (DigitalEquipment Corporation, UK, 1986) 问卷组成:10个问题,在5点量表上打分 量表中文版以及计分方式:查看这里 ...

    可用性量表很多(见下图),SUS只是其中一个。 


    SUS简介:

    量表作者:John Brooke  (DigitalEquipment Corporation, UK, 1986)

    问卷组成:10个问题,在5点量表上打分

    量表中文版以及计分方式:查看这里

    信度:0.85  (见上图)

     

    优点:

    • 问卷短,省时
    • 最后会得出一个分数,直观
    • 免费
    • 对于小样本( n<14),SUS的优势更明显(见下图),图中的意思:随即抽取14名被试的SUS问卷均能判断网站1比网站2要好,而抽取的CSUQ问卷只有90%能做出这个正确的判断)

    用途:

    • 同一个界面,完成不同的任务之间进行比较(因为有的任务可能会更难或不常使用,例如安装软件这个操作可能只需执行一次,而不像其他操作那样频繁使用;用户在完成不同类型和难度的任务之后,分别评多次SUS的分数,然后再进行对比,因为如果所有任务只评一个SUS分数的话,可能会因为某些任务较难而降低了评分);
    • 同一个界面,先后不同版本之间进行比较(不过需要注意的是增加新功能或改版后,用户在初期可能会不适应,而导致SUS在短期内会下降,但长期会回升)
    • 备用方案之间、竞品之间进行比较。
    • 不同种类的界面之间进行比较(例如同一个产品有PC版、网页版、Android版、iSO版;或者百度地图与微信之间比较)

    (Bangor没怎么解释为什么可以在不同任务、不同时间、不同界面之间进行比较)

     

    如何解释SUS分数?

    1)SUS分数反映的是总体的可用性,单独抽取某个题目的得分在产品之间作横向比较意义不大

      理由:

      a)10道题目之间高度相关;

      b)Bangor等人在2008年的那篇paper中,通过因素分析结果发现,10道题只提取出一个因素 ;但2009年有研究者提出,SUS分数反映了总体的满意度,同时第4和第10道题测量了易于学习性(learnability),而其他8道题测量了可用性。(详见

     

    2)如果某个界面的SUS分数为76,这表示什么?


    解决方案一:

         AT&T Labs的Bangor,Kortum 和Miller在2009年发了一篇文章来解决这个问题。他们在SUS的结尾增加了1个问题(见下图),让用户使用Poor、Ok、Good等形容词来总体评价这个用户界面,其用意是想将SUS与这些形容词关连起来。

     以下是每个形容词对应的SUS分数:按照这次的数据,被用户评为Good的那些界面,SUS的平均分为71.4(标准差为:11.6,感觉有点离散)。

          不过Bangor等人并没有明确说,是否有足够的证据来证明可以使用71.4或某个分数来判断一个产品是否合格

    解决方案二:

        就像GRE的分数一样,将SUS分数转换成percentile百分位数,解释的时候就说:“比百分之xxx的其他界面的SUS分数要高”。(不过这需要一个相对较大的SUS分数库)

         例如,由Jeff Sauro开发的SUS Package收集了500多个研究、5000多份SUS问卷。在这个分数库中,如果SUS得分为74,那么它比500多个界面中的70%都要高(见下图)


    结合其他2篇paper中的SUS平均分,可以看出当一个界面的SUS得分为78时,可以说它大约比75%的其他用户界面都要好

    a) Bangor, Kortum & Miller, 2009的研究中,3个百分数如下

        75%:77.8

        50%:70.5

        25%:62.6

    a) Bangor, Kortum & Miller, 2008的研究中,3个百分数如下

        75%:78.5

        50%:70.9

        25%:62.3

     

    如何报告SUS分数?

        可以参考一下Jeff Sauro的SUS Package

    图A:计算SUS,并区分出Usability和Learnability 2个维度

    图B:将SUS转换成百分位数

    图C:比较SUS


    SUS十年回顾

    Bangor等人在2008年发的那篇论文,总结了从1996年开始,收集了206个研究、2324份SUS问卷(即2324个被试)。(注:以下内容以这篇paper为主,同时辅以其他论文上的数据)

    一、SUS分数的分布

    •   2324份问卷的SUS平均分为70.14,标准差21.71,取值范围是0-100;206个研究的SUS平均分为 69.69,标准差 = 11.87,取值范围是30-93.9;
    •  2324份问卷的SUS分数呈负偏态分布,206个研究的SUS平均分接近正态分布


    (注:Figure 2是直接计算2324个被试的2324份问卷的SUS平均分;

    因为一个研究大约会有10个被试左右,所以Figure3是先计算每个研究所有被试的SUS平均分,再计算这206个研究的平均分)

     

    结合其他2篇paper和blog中的SUS平均分,可以看出当一个界面的SUS得分为70时,可以说它达到了平均水平

    1. M=69.69   206个研究、2324份问卷    (Bangor, Kortum & Miller, 2009)
    2. M=69.69   273个研究、3500份问卷    (Bangor, Kortum & Miller, 2008)
    3. M=68        500个研究、>5000份问卷  (Jeff Sauro)

     

    2)不同类型的界面测到的SUS分数差异不大

          将206个研究界面分成6类,方差分析发现,6类之间差异不显著


    3)SUS与任务完成率、完成时间不太相关

    JeffSauro发现,SUS分数与任务完成率、完成时间的相关系数为r=.24,属于轻度相关(但原文中没说是否显著)。r=.24的意思是:任务完成率与完成时间这2个数值5.76%的方差可以用SUS分数来解释(5.76%=0.24 x 0.24)。不知道Sauro是如何可以计算SUS与另外2个变量的相关,却得出一个相关系数,而不是2个。


    展开全文
  • 系统可用性量表(SUS)是一种成本较低但有用的工具,它用来评估产品可用性,包括网站、手机、交互式语音应答系统、电视应用等等。它提供了一种易于理解的评分方式,分数范围从0(负)到100(正)。尽管以100分计在很...
  • 神经解剖学的教学提出了相关的挑战,例如,获得适当保存的尸体的限制,解剖学实验室维护的高成本以及... 根据系统可用性量表,该应用程序获得了好评。 结果表明,研究参与者认为该测试应用程序对神经解剖学学习很有用。
  • 这些信息的现成可用性应加强 ABIC 在临床实践中的应用,并促进对其在各种常规和特殊教育项目中的教育规划和安置的有效性的研究。 甚至在期待已久的 1978 年出版之前,多元文化多元评估系统 (SOMPA) (Mercer & ...
  • 心理测评系统-Asp

    2021-06-17 11:12:07
    此心理测试系统已预装300个测评量表,使用者可用多个量表组合生成问卷,问卷为电脑/手机自动适配,测评完成后系统实时生成测评报告。使用者还可以自行录入多维度量表,以满足个性需求,也就是说,你可以根据需求,...
  • 得到APP简介 得到APP是由罗辑思维团队推出的...在设计师完成某个页面后,设计师和维护人员通常需要对界面进行可用性的检查和评估。在设计周期初期用户量不多的时候,常用的评估方法主要有启发式评估、可用性测试。...
  • 操作系统教程第五版课后题答案pdf
  • 对于可用性测试,业内人士存在一些普遍认可的原则。它们神圣地如同自然科学里的理论,似乎我们只能对其言听计从、俯首称臣才能践行出“好的可用性测试”。其实,即便是科学,它的一个特征也是“可证伪性”——理论的...
  • Implementing the usability testing method 实施可用性测试方法 Reporting usability test findings 报告可用性测试结果 Question no. 2 — Can this guide be followed for testing the usability of mobile ...
  • 卡分类树测试产品React卡系统可用性量表(SUS) 净促销员分数(NPS) 有关更多信息,请参见网站。 屏幕截图 安装与设定使用以下之一:使用Git克隆代码( git clone https://github.com/carlsonp/kort.git ) 从...
  • 用户体验与可用性测试_读书笔记

    千次阅读 2019-10-13 20:02:09
    1.2 产品可用性不等于产品易用性 1.2.1 产品可用性可有可无吗 usability 是基本需求, 不是魅力需求 1.2.2 根本没法用的产品 乱七八糟的搜索引擎: 搜到的全是广告; 弄错了大小写就搜不到东西 繁琐的订单...
  • 计算机操作系统课程整理的期末复习资料,内容简洁全面,包含以下8章内容: 第一章 操作系统概述、第二章 进程、线程与作业、第三章 中断与处理器调度、第四章:互斥、同步与通信、第五章 死锁与饥饿、第六章 存储...
  • 摘要:本课题采用问卷调查与现场实验相结合的方法,根据影响输入法体验的因素选出并分析了最优九宫格输入法和最优全键盘输入法在输入文本时的可用性和用户满意度。结果表明:不含英文时,九宫格输入法表现佳,含英文...
  • 本节书摘来自异步社区《可用性测试手册(第2版)》一书中的第1章,第1.4节,作者【美】Jeffrey Rubin(鲁宾) , Dana Chisnell(切斯尼尔),更多章节内容可以访问云栖社区“异步社区”公众号查看 1.4 实现可用性的...
  • 嵌入式系统及应用嵌入式系统及应用
  • 制定可用性测试计划(1)

    千次阅读 2014-09-28 10:36:08
    测试计划是整个可用性测试的基石。计划应当阐明如何测试,何时、何地,由谁来推动测试,为何测试以及测试内容。不过,有时在项目期限临近的巨大压力下,你可能不打算写一份详尽的测试计划。毕竟,你认为自己对即将...
  • 注意力不集中现象在儿童中比较普遍,目前,国内外存在的注意力训练方法有纸质量表、行为观察、生物反馈、计算机辅助训练等方式。这些方法无法便捷实现大量人群的训练和训练结果的持续有效追踪。而对儿童进行注意力...
  • 素材来源 | CSDN整理 |最后一个bug1.操作系统(Operating System,OS):是管理计算机硬件与软件资源的系统软件,同时也是计算机系统的内核与基石。操作系统需要处...
  • VxWorks实时操作系统.pptx
  • 既能构架大型关键业务系统的商用服务器,也能支持嵌入式设备。 MiniX基于微内核加载的类UNIX系统,名为MINIX(即小型的UNIX),并开放全部源代码给大学教学和研究工作,Linux之父林纳克斯,正是在受了MiniX的启发...
  • UI-可用性测试

    2009-06-26 20:11:00
    可用性测试的定义 可用性测试是指在设计过程中被用来改善易用性的一系列方法。我们为用户提供一系列操作场景和任务让他们去完成,这些场景和任务与您的产品或服务密切相关。通过观察,我们来发现过程中出现了什么...
  • 养老院管理系统技术方案
  • 嵌入式系统-复习大纲2012
  • 可用性测试的那些事

    2017-07-03 11:24:00
    可用性测试是指通过对典型用户实施测试来对产品或服务做出评价。在一次典型的测试中,用户要完成一系列典型任务。与此同时,观察者会在一旁观察、倾听、做笔记。可用性测试的目的就是为了发现可用性问题,收集定性和...
  • 楼宇能源管理系统V1-20110907-2
  • 程序员必知的 89 个操作系统核心概念

    万次阅读 多人点赞 2020-03-31 19:13:39
    操作系统(Operating System,OS):是管理计算机硬件与软件资源的系统软件,同时也是计算机系统的内核与基石。操作系统需要处理管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 4,785
精华内容 1,914
关键字:

系统可用性量表