精华内容
下载资源
问答
  • 关于试题分析报告中命题难度和区分度计算的有关说明   1、命题的难度:难度是指试题与试卷难易程度的指标。  (1)客观性试题的难度计算:通常用通过率来衡量。  P=R/N×100%(P为通过率,R为答对或通过该...

    关于试题分析报告中命题难度和区分度计算的有关说明

     

    1、命题的难度:难度是指试题与试卷难易程度的指标。 

    (1)客观性试题的难度计算:通常用通过率来衡量。

     P=R/N×100%(P为通过率,R为答对或通过该题目的人,N为全体考生数)

    (2)主观性试题的难度计算:

    P=X/W×100%(P为通过率,X为被试在某一试题上的平均分,W为该题的满分)

    (3)整个试卷的难度计算:试卷的难度是指一份试卷的总体难易程度,其由试卷中每道题的难度决定。其计算办法为:将每道题目的难度与满分值相乘的积相加,然后将其总和除以试卷的满分值,所得的商即为整个试卷的难度。

     

    2、命题的区分度:区分都是指测验试题对考生实际水平的区分程度,其取值范围介于-1.00和+1.00之间。

    (1)客观性试题的区分度计算: 

    D=Ph-Pl(D为区分度, Ph为高分组通过率,Pl为低分组通过率。注:先将被试者依照总分从高到低排列,然后将总分最高的27%和最低的27%的被试分别定为高分组和低分组。)

    (2)主观性试题的区分度计算:

    D=(XH-XL)/N(H-L)(XH为高分组该题总分, XL为低分组该题总分,H为该题最高分,L为该题最低分,N为考生总人数的25%)

    (3)整个试卷的区分度计算:试卷的区分度是指一份试卷总体对学生的区分程度。其计算办法为:将每道题目的区分度与满分值相乘的积相加,然后将其总和除以试卷的满分值,所得的商即为整个试卷的区分度。

    展开全文
  • 有时候需要为字段创建索引时,但是字段太长,为整个字段创建索引的话,太浪费存储空间了,所以需要计算出字段区分度,选择合适的索引长度。 计算字段文本区分度的公式: select COUNT(DISTINCT left(column_name,...

    有时候需要为字段创建索引时,但是字段太长,为整个字段创建索引的话,太浪费存储空间了,所以需要计算出字段区分度,选择合适的索引长度。

    计算字段文本区分度的公式:

    select  COUNT(DISTINCT left(column_name,length))/COUNT(*) from table_name
    

    其中column_name是需要建立索引的字段,而length则是选择这个字段用来建立索引的长度。

    公式的作用就是,选择出字段长度,去重求总,这时候就可以知道使用这个长度来建立索引,大概会有多少值,然后再把这个值除以总数,得到的值越接近1,则表示用这个长度来建立索引的区分度越大,自然就越适合。

    测试表USER_ROLE的数据如下:
    在这里插入图片描述

    比如要对字段USER_NAME建立索引,代入上述公式

    先选择这个字段的1个长度来建立索引,看下区分度:

    select  COUNT(DISTINCT left(USER_NAME,1))/COUNT(*) from USER_ROLE
    

    区分度如下:
    在这里插入图片描述
    再选择这个字段的3个长度来建立索引:

    select  COUNT(DISTINCT left(USER_NAME,1))/COUNT(*) from USER_ROLE
    

    看下区分度:
    在这里插入图片描述
    再选择这个字段的4个长度来建立索引:

    select  COUNT(DISTINCT left(USER_NAME,4))/COUNT(*) from USER_ROLE
    

    看下区分度:
    在这里插入图片描述
    最后选择这个字段的5个长度来建立索引

    select  COUNT(DISTINCT left(USER_NAME,5))/COUNT(*) from USER_ROLE
    

    看下区分度:
    在这里插入图片描述

    可以发现长度4和长度5的区分度都是1,那自然选择占用空间小的方案了。

    总结

    要建立大字段的索引时,可以配合计算字段文本区分度的公式,选出合适的字段长度来建立索引。

    展开全文
  • 数据库计算索引区分度

    千次阅读 2018-11-21 10:03:40
    如何正确的建立数据库表字段索引 1、索引不是在创建表的时候创建的;...3、其它字段在建立索引的时候需要计算字段的区分度计算SQL如下: select COUNT(DISTINCT column_name)/COUNT(*) from table_name...

    如何正确的建立数据库表字段索引

    1、索引不是在创建表的时候创建的;系统在运行一个阶段后创建索引。

    2、对于主键、外键、排序等字段优先加索引。

    3、其它字段在建立索引的时候需要计算字段的区分度,计算SQL如下:

    select  COUNT(DISTINCT column_name)/COUNT(*) from table_name

    展开全文
  • 索引长度与区分度

    千次阅读 2015-04-19 14:52:34
    1:查询频繁 2:区分度高 3:长度小 4: 尽量能覆盖常用查询字段. 1: 索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多). 针对列中的值,从左往右截取部分,来建索引 1: 截的越短, ...
    1:查询频繁 2:区分度高  3:长度小  4: 尽量能覆盖常用查询字段.



    1: 索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多).


    针对列中的值,从左往右截取部分,来建索引
    1: 截的越短, 重复度越高,区分度越小, 索引效果越不好
    2: 截的越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大--增删改变慢,并间影响查询速度.


    所以, 要在  区分度 + 长度  两者上,取得一个平衡.


    惯用手法: 截取不同长度,并测试其区分度,

    <span style="font-size:18px;">select count(distinct left(word,6))/count(*) from dict; 
    +---------------------------------------+
    | count(distinct left(word,6))/count(*) |
    +---------------------------------------+
    |                                0.9992 |
    +---------------------------------------+</span>

    截取word字段长度,从1开始截取,计算字符前缀没有重复的字符占全部数据的比例



    对于一般的系统应用: 区别度能达到0.1,索引的性能就可以接受.


    3:多列索引
     3.1 多列索引的考虑因素---  
    列的查询频率 , 列的区分度, 
    以ecshop商城为例, goods表中的cat_id,brand_id,做多列索引
    从区分度看,Brand_id区分度更高, 

    select count(distinct cat_id) / count(*) from  goods;
    +-----------------------------------+
    | count(distinct cat_id) / count(*) |
    +-----------------------------------+
    |                            0.2903 |
    +-----------------------------------+
    1 row in set (0.00 sec)
    
    mysql> select count(distinct brand_id) / count(*) from  goods;
    +-------------------------------------+
    | count(distinct brand_id) / count(*) |
    +-------------------------------------+
    |                              0.3871 |
    +-------------------------------------+
    1 row in set (0.00 sec)

    但从 商城的实际业务业务看, 顾客一般先选大分类->小分类->品牌,
    最终选择 index(cat_id,brand_id)来建立索引
    有如下表(innodb引擎), sql语句在笔记中, 
    给定日照市,查询子地区, 且查询子地区的功能非常频繁,
    如何优化索引及语句?

    +------+-----------+------+
    | id   | name      | pid  |
    +------+-----------+------+
    | .... | .... | .... |
    | 1584 | 日照市 | 1476 |
    | 1586 | 东港区 | 1584 |
    | 1587 | 五莲县 | 1584 |
    | 1588 | 莒县    | 1584 |
    +------+-----------+------+


    1: 不加任何索引,自身连接查询

    explain select s.id,s.name from it_area as p inner join it_area as s on p.id=s.pid   where p.name='日照市' \G
    *************************** 1. row ***************************
               id: 1
      select_type: SIMPLE
            table: p
             type: ALL
    possible_keys: NULL
              key: NULL
          key_len: NULL
              ref: NULL
             rows: 3263
            Extra: Using where
    *************************** 2. row ***************************
               id: 1
      select_type: SIMPLE
            table: s
             type: ALL
    possible_keys: NULL
              key: NULL
          key_len: NULL
              ref: NULL
             rows: 3263
            Extra: Using where; Using join buffer
    2 rows in set (0.00 sec)

    2: 给name加索引

    explain select s.id,s.name from it_area as p inner join it_area as s on p.id=s.pid   where p.name='日照市' \G
    *************************** 1. row ***************************
               id: 1
      select_type: SIMPLE
            table: p
             type: ref
    possible_keys: name
              key: name
          key_len: 93
              ref: const
             rows: 1
            Extra: Using where
    *************************** 2. row ***************************
               id: 1
      select_type: SIMPLE
            table: s
             type: ALL
    possible_keys: NULL
              key: NULL
          key_len: NULL
              ref: NULL
             rows: 3243
            Extra: Using where; Using join buffer
    2 rows in set (0.00 sec)

    3: 在Pid上也加索引

    explain select s.id,s.name from it_area as p inner join it_area as s on p.id=s.pid   where p.name='日照市' \G
    *************************** 1. row ***************************
               id: 1
      select_type: SIMPLE
            table: p
             type: ref
    possible_keys: name
              key: name
          key_len: 93
              ref: const
             rows: 1
            Extra: Using where
    *************************** 2. row ***************************
               id: 1
      select_type: SIMPLE
            table: s
             type: ref
    possible_keys: pid
              key: pid
          key_len: 5
              ref: big_data.p.id
             rows: 4
            Extra: Using where
    2 rows in set (0.00 sec)


    展开全文
  • mysql 索引长度与区分度的选择

    千次阅读 2019-02-17 23:14:19
    区分度高 长度小 尽量能覆盖常用查询字段 索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多). 针对列中的值,从左往右截取部分,来建索引 1: 截的越短, 重复度越高,区分度越小, ...
  • mysql中索引长度与区分度的选择

    千次阅读 热门讨论 2017-04-01 14:36:04
    问题背景 现在有这么一个需求,比如说商品表中的商品名称和商品描述两个字段,有时候我们根据商品名称或者描述来查询商品,但是...区分度与索引长度的权衡 索引长度越低,索引在内存中占的长度越小,排序越快,然而区
  • 问题背景现在有这么一个需求,比如说商品表中的商品名称和商品描述两个字段,有时候我们根据商品名称或者描述来查询商品,但是所有... 区分度与索引长度的权衡索引长度越低,索引在内存中占的长度越小,排序越快,...
  • 模型区分度衡量指标-KS值

    千次阅读 2019-10-02 23:26:36
    2. 按顺序选取截断点,并计算TPR和FPR ---也可以 只选取n个截断点 ,分别在1/n,2/n,3/n等位置 3. 横轴为样本的占比百分比(最大100%),纵轴分别为TPR和FPR,可以得到KS曲线 4. TPR和FPR曲线分隔最开的位置就是...
  •  难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。  一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于...
  • 1 SPSS信分析 一分半信 1李老师对班上 9 位同学的随堂测验 Y 表示答对 N表示答错测验结果如表 1 所示请计算其信 1 随堂测验成绩 2 相关性 解1首先根据题意将资料输入 SPSS建立数据文件 2选择 " 转换 "|" 重新...
  • 有效性指标中的区分能力指标:KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。 好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。KS的计算...
  • mysql 索引失效 -- 数据区分度不足30%

    万次阅读 2019-08-28 09:36:28
    ...1.当表的索引被查询,会使用最好的索引,除非优化器使用全表扫描更有效。...2.优化器优化成全表扫描取决与使用最好索引查出来的数据是否超过表的30%的数据。...根据上面的理论,时间断的范围通过...5.计算操作
  • 针对现有的局部信任度计算方法忽视了交互经验的时效性及充分性等问题, 提出一种证据理论框架下的局部信任度计算方法, 该方法采用了时效因子计算函数来区分不同时间内的交互经验在局部信任度计算中的重要性;...
  • 利用最短路径方法为每个连接寻找工作路由,利用Markov模型计算通道不可用,冗余不可用越小的无保护连接越先分配保护波长。利用区分可用方法可以在满足每个连接可用要求的同时,减少环网所需的波长里程数。...
  • 搜索引擎的检索模型-查询与文档的相关度计算

    万次阅读 多人点赞 2012-09-17 14:12:09
     搜索结果排序时搜索引擎最核心的部分,很大程度上决定了搜索引擎的质量好坏及用户满意。实际搜索结果排序的因子有很多,但最主要的两个因素是用户查询和网页内容的相关,以及网页链接情况。这里我们主要总结...
  • 通过分析传统评价模型存在的问题,提出了指标区分权重的概念,论证了为什么底层指标权重不容专家拟定;...论证了由单指标隶属度计算合成隶属度的指标权重是且只能是指标区分权重,给出相对合理的方案排序方法。
  • 计算机复试面试题总结

    万次阅读 多人点赞 2019-03-07 20:06:56
    5介绍以下各种树 树,二叉树:有左右子树的区分不超过2. 二叉排序树:左子树均小于根,根均小于右节点。。 线索二叉树:设置两个标识标记左右指针指向的是孩子还是前躯节点。 平衡二叉树:左右子树高度差绝对值...
  • 利用区分矩阵能很容易计算出弱约简和遗传算法可以在全局寻优的优势,将染色体对区分函数的覆盖作为适应函数的参数,提出了一种基于遗传算法和区分矩阵的属性约简算法。算法中从粒计算的角度,重新度量粒度,对...
  • 利用区分矩阵能很容易计算出弱约简和遗传算法可以在分解寻优的优势,将染色体对区分函数的覆盖作为适应函数的参数,提出了一种基于遗传算法和区分矩阵的属性约简算法。算法中从粒计算的角度,重新划分粒度,对...
  • 已知信源符号为英文字母不区分大小写和空格 输入一篇英文的信源文档 输出列出每两个字母之间的互信息并计算平均互信息 基本思想 读入英文字符分两次读入 第一次读入计算字符信息熵第二次读入计算信道疑义 ...
  • 三、权重计算 1、上节回顾 上一节我们利用SPSS中的数据标准化方法及主成分分析法,得出了“解释的总方差”和“成分矩阵”(如下图) 接下来我们将利用主成分分析得出的数据计算指标权重 2、权重计算 (1)输入数据 ...
  • CSS 样式,如何计算临近颜色值?

    千次阅读 2019-01-05 17:55:44
    如果颜色是固定的,直接计算好固定就行,如果是动态或者用户设置的颜色值,就需要一定的算法来计算临近的颜色。 我在看 MDN 时,发现了 RGB 和 HSL,发现 HSL 的值通过修改色调(hue)、饱和(saturation)和明...
  • 本文介绍了图计算中的核心概念与算法,了解这些基本知识可以帮助我们更好更快的探索一个图,找到相应的解决方案,同时也是更深层次研究的基础。
  • 前几天在做图像曝光(Exposure)这个小功能时,找了半天资料都没找到,后来在stackoverflow上翻到了计算方法,方法很简单,实际测试时,发现和photoshop效果还挺接近的。下面是基于opencv的相关代码示例,strength...
  • 移动计算

    千次阅读 2018-06-24 12:02:02
    移动计算是随着移动通信、互联网、分布式计算等技术的发展而兴起的新技术。移动计算技术将使计算机或其它信息智能终端设备在无线环境下实现数据传输及资源共享,将信息传递给远程服务器下的一种分布计算环境下的技术...
  • 视觉SLAM笔记(59) 相似度计算

    万次阅读 2019-11-17 10:49:06
    相似度理论和计算、增加字典规模、相似性评分的处理、关键帧的处理、检测之后的验证、与机器学习的关系
  • [并行计算] 1. 并行计算简介

    万次阅读 多人点赞 2017-07-20 15:30:07
    这篇帖子旨在为并行计算这一广泛而宏大的话题提供一个非常快速的概述,作为随后教程的先导。因此,它只涵盖了并行计算的基础知识,实用于刚刚开始熟悉该主题的初学者。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 161,304
精华内容 64,521
关键字:

区分度如何计算