精华内容
下载资源
问答
  • weka安装自带的数据集

    2011-01-20 17:50:23
    weka安装自带的数据集,安装weka后在weka根目录下的data文件夹下可以找到。
  • Mac下载Weka后,自带的数据集在哪里 首先下载好Weka,下好后发现不像windows一样,找不到自带的数据集。不过后来在一个压缩包里面找到了它。 数据集位置 首先显示weka的包内容 然后通过路径Contents -> Java -&...

    Mac下载Weka后,自带的数据集在哪里

    首先下载好Weka,下好后发现不像windows一样,找不到自带的数据集。不过后来在一个压缩包里面找到了它。

    数据集位置

    首先显示weka的包内容
    打开weka包
    然后通过路径Contents -> Java -> weka.jar 找到包含自带数据集的压缩包,并进行压缩。

    压缩包位置
    复制到外面压缩,压缩后,就可以直接搜索你要的数据集了,比如说我在第一次实验中要用到的iris.arff位置在weka -> gui -> beans -> templates -> iris.arff。

    iris.arff位置
    总感觉好像有别的操作方式,希望有大神能路过给予指点👏
    作为小白的Mac用户,在学习计算机的过程中总是遇到一些奇奇怪怪的问题(可能问题太简单,只有小白才会问,总是不能在某度找到答案)。这次我打算记录下来,方便自己以后查看,也希望可以帮助和我一样小白的同学~

    展开全文
  • 这是转自博友的博客,讲解了java调用weka两种聚类算法的demo,在调用之前,必须下载weka jar包导入eclipse里面,并下载weka自带的数据集 进行测试; 本人只是进行了简单的测试,发现算法可以完美调用,但是算法的...

    这是转自博友的博客,讲解了java调用weka两种聚类算法的demo,在调用之前,必须下载weka jar包导入eclipse里面,并下载weka自带的数据集 进行测试;

    本人只是进行了简单的测试,发现算法可以完美调用,但是算法的精髓还有待深入理解;

    转载自:http://rangerwolf.iteye.com/blog/2012208


    在这里将使用Weka自带的K-means以及EM算法对同一份数据进行聚类。

    目前使用的是自带的数据集。我也不太清楚这样聚类的效果如何 sigh...

     

    Weka Version: 3.7.10

     

    K-Means K-均值算法

    Java代码  收藏代码

    import java.io.File;

    import weka.clusterers.SimpleKMeans;
    import weka.core.DistanceFunction;
    import weka.core.Instances;
    import weka.core.converters.ArffLoader;


    public class TestKMeans {
        
        public static void main(String[] args) {
            Instances ins = null;
            
            SimpleKMeans KM = null;
            
            // 目前没有使用到,但是在3.7.10的版本之中可以指定距离算法
            // 默认是欧几里得距离
            DistanceFunction disFun = null;
            
            try {
                // 读入样本数据
                File file = new File("D:\\Program Files\\Weka-3-7\\data\\contact-lenses.arff");
                ArffLoader loader = new ArffLoader();
                loader.setFile(file);
                ins = loader.getDataSet();
                
                // 初始化聚类器 (加载算法)
                KM = new SimpleKMeans();
                KM.setNumClusters(2);         //设置聚类要得到的类别数量
                KM.buildClusterer(ins);        //开始进行聚类
                
                // 打印聚类结果
                System.out.println(KM.toString());
    //            for(String option : KM.getOptions()) {
    //                System.out.println(option);
    //            }
    //            System.out.println("CentroIds:" + tempIns);
            } catch(Exception e) {
                e.printStackTrace();
            }
            
        }
    }

    在上面的算法之中,使用的是SimpleKMeans这个类。

     

    使用EM算法的方法几乎一样,唯一的不同就是在设置类数目的时候可以设置成-1. 如下:

    Java代码  收藏代码

    EM em = null;
    em = new EM();
    // 使用交叉验证自动选择聚类数目
    em.setNumClusters(-1);
    em.setMaxIterations(100);
    em.buildClusterer(ins);

    具体可以看源码:

    Java代码  收藏代码

    /**
       * Set the number of clusters (-1 to select by CV).
       *
       * @param n the number of clusters
       * @throws Exception if n is 0
       */
      @Override
      public void setNumClusters(int n) throws Exception {

        if (n == 0) {
          throw new Exception("Number of clusters must be > 0. (or -1 to "
              + "select by cross validation).");
        }

        if (n < 0) {
          m_num_clusters = -1;
          m_initialNumClusters = -1;
        } else {
          m_num_clusters = n;
          m_initialNumClusters = n;
        }
      }

    关于EM 以及K-Means的具体描述,请自行百度吧~



    展开全文
  • 下面是Weka自带的“weather.arff”文件,在Weka安装目录的“data”子目录下可以找到。 需要注意的是,在Windows记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。推荐使用UltraEdit这样的字符...
    ARFF文件是Weka默认的储存数据集文件。每个ARFF文件对应一个二维表格。表格的各行是数据集的各实例,各列是数据集的各个属性。
    下面是Weka自带的“weather.arff”文件,在Weka安装目录的“data”子目录下可以找到。
    需要注意的是,在Windows记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。推荐使用UltraEdit这样的字符编辑软件察看ARFF文件的内容。
    % ARFF file for the weather data with some numric features
    %

    @relation weather

    @attribute outlook {sunny, overcast, rainy}
    @attribute temperature real
    @attribute humidity real

    @attribute windy {TRUE, FALSE}

    @attribute play {yes,no}
    @data

    %
    % 14 instances
    %
    sunny,85,85,FALSE,no
    sunny,80,90,TRUE,no
    overcast,83,86,FALSE,yes
    rainy,70,96,FALSE,yes
    rainy,68,80,FALSE,yes
    rainy,65,70,TRUE,no
    overcast,64,65,TRUE,yes
    sunny,72,95,FALSE,no
    sunny,69,70,FALSE,yes
    rainy,75,80,FALSE,yes
    sunny,75,70,TRUE,yes
    overcast,72,90,TRUE,yes
    overcast,81,75,FALSE,yes
    rainy,71,91,TRUE,no

    识别ARFF文件的重要依据是分行,因此不能在这种文件里随意的断行。空行(或全是空格的行)将被忽略。

    以“%”开始的行是注释,WEKA将忽略这些行。如果你看到的“weather.arff”文件多了或少了些“%”开始的行,是没有影响的。

    除去注释后,整个ARFF文件可以分为两个部分。第一部分给出了头信息(Head information),包括了对关系的声明和对属性的声明。第二部分给出了数据信息(Data information),即数据集中给出的数据。从“@data”标记开始,后面的就是数据信息了。

    虽然Weka也支持其他一些格式的文件,但是ARFF格式是支持的最好的。因此有必要在数据处理之前把数据集的格式转换成ARFF。

    CSV
    将CSV转换为ARFF最迅捷的办法是使用WEKA所带的命令行工具。
    运行WEKA的主程序,在菜单中找到“Simple CLI”模块,它可提供命令行功能。在新窗口的最下方(上方是不能写字的):输入框写上

    java weka.core.converters.CSVLoader filename.csv > filename.arff

    即可完成转换。
    在WEKA 3.5中提供了一个“Arff Viewer”模块,我们可以用它打开一个CSV文件将进行浏览,然后另存为ARFF文件。
    进入“Exploer”模块,从上方的按钮中打开CSV文件然后另存为ARFF文件亦可。

    C4.5
    与CSV文件类似。

    XLS
    Excel的XLS文件可以让多个二维表格放到不同的工作表(Sheet)中,我们只能把每个工作表存成不同的CSV文件。打开一个XLS文件并切换到需要转换的工作表,另存为CSV类型,点“确定”、“是”忽略提示即可完成操作。

    接下来把得到的CSV文件按照前述步骤转换为ARFF即可。

    MAT
    在Matlab中的二维表格是一个矩阵,我们通过这条命令把一个矩阵存成CSV格式。

    csvwrite('filename',matrixname)

    需要注意的是,Matllab给出的CSV文件往往没有属性名(Excel给出的也有可能没有)。而WEKA必须从CSV文件的第一行读取属性名,否则就会把第一行的各属性值读成变量名。因此我们对于Matllab给出的CSV文件需要用文本编辑软件打开,手工添加一行属性名。注意属性名的个数要跟数据属性的个数一致,仍用逗号隔开。
    展开全文
  • weka:调用内置算法挖掘数据关联规则

    千次阅读 2016-10-11 17:11:30
    创建一个Java Project,使用weka自带的数据集weather.nomial.arff和weather.number.arff,调用weka中的apriori算法,以及FPGrowth算法分别进行挖掘关联规则。

    创建一个Java Project,使用weka中自带的数据集weather.nomial.arff和weather.number.arff,调用weka中的apriori算法,以及FPGrowth算法分别进行挖掘关联规则。

     

    public class test3 {



    /**
    * @param args
    * @throws Exception 
    */
    public static void main(String[] args) throws Exception {

    /*处理weather.nominal.arff
    * */
    Instances instances = DataSource.read("C:\\Program Files (x86)\\Weka-3-5\\data\\weather.nominal.arff");
    instances.setClassIndex(instances.numAttributes() - 1); 
    /*创建Apriori实例
    * */
    Apriori apriori = new Apriori(); 
    apriori.buildAssociations( instances ); 
    System.out.println(apriori.toString());

                   /*处理weather.number.arff

    * */
    Instances test=DataSource.read("C:\\Program Files (x86)\\Weka-3-5\\data\\weather.arff");
    //获取对象的数据
              test.setClassIndex(test.numAttributes() - 1); 
              //创建一个离散实例
    Discretize discretize = new Discretize();
                  /*离散化处理
                   * */

    String[] options = new String[6]; 
                options[0] = "-B"; options[1] = "8"; options[2] = "-M"; options[3] = "-1.0";options[4] = "-R"; options[5] = "2-last"; 
                   discretize.setOptions(options); 
    discretize.setInputFormat(test); 
    /*获取离散化处理后的数据对象
    * */
    Instances newInstances2 = Filter.useFilter(test, discretize); 
    newInstances2.setClassIndex(newInstances2.numAttributes() - 1); 
    /*创建Apriori实例
    * */
    Apriori apriori2 = new Apriori(); 
    apriori2.buildAssociations(newInstances2 ); 
    System.out.println(apriori2.toString());



    }


    }
    展开全文
  • weka中Saving and loading Trained models

    千次阅读 2007-07-17 02:02:00
    最近使用weka的一些分类器训练了一些样本,样本集很...训练集使用的weka自带的数据集weather.nominal.arff,分类算法使用的svm。使用序列化的方式将建立好的模型保存到文件名为svm.model中。package spider.classific
  • Weka可视化

    千次阅读 2018-04-02 07:14:48
    weka中ID3算法及可视化 weka之对id3实现可视化 scikit-learn决策树算法类库使用小结 sklearn提供的自带的数据集 sklearn教程
  • 我使用的是Weka自带的示例数据集weka.core.Instances容纳完整的数据集,可以提取行信息与列信息weka.core.Instance一行信息,没有列信息weka.core.Attribute列信息一、加载数据1.从文件中加载数据基本的读取数据方式...
  • Weka是一个用Java编写的数据挖掘工具,能够运行在各种平台上。它不仅提供了可以直接用于数据挖掘的软件,还提供了src代码,使用者可以修改源代码,进行二次开发。但是,由于其使用了Java虚拟机,导致其不适合处理...
  • 我使用的是Weka自带的示例数据集 weka.core.Instances容纳完整的数据集,可以提取行信息与列信息 weka.core.Instance一行信息,没有列信息 weka.core.Attribute列信息 一、加载数据 1.从文件中加载数据 基本的读取...
  • Weka: ARFF是什么

    2009-04-20 16:32:37
    下面是Weka自带的“weather.arff”文件,在Weka安装目录的“data”子目录下可以找到。 需要注意的是,在Windows记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。推荐使用UltraEdit这样的字符...
  • weka J48 demo代码

    2015-10-25 00:09:08
    决策树J48的demo代码,对自带的数据集进行分类
  • (1)weather数据集:它是weka自带的数据集,格式为weather.nominal.arff或weather.numeric.arff,前者表示的是全是名称型属性,后者表示的带有数值型属性。使用的时候,直接在 .\Weka-3-8-4\data路径下调。 (2)...
  • weka怎么把csv文件转化成arff文件

    万次阅读 2013-08-28 18:30:37
    下面是Weka自带的“weather.arff”文件,在Weka安装目录的“data”子目录下可以找到。  需要注意的是,在Windows记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。推荐使用UltraEdit这样的字符...
  • weka过滤器主要用于数据预处理阶段对数据集的各种操作。 今天简单地使用一下过滤器: 首先打开一个自带数据集weather.numeric.arff,这是一个关于通过天气条件,气温以及风力等因素来判断是否要play。可以看到...
  • 下面是Weka自带的“weather.arff”文件,在Weka安装目录的“data”子目录下可以找到。 需要注意的是,在Windows记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。推荐使用UltraEdit这样的字符...

空空如也

空空如也

1 2
收藏数 21
精华内容 8
关键字:

weka自带的数据集