分类数据有哪些

分类数据有哪些

分类数据(categorical data)是按照现象的某种属性对其进行分类或分组而得到的反映事物类型的数据,又称定类数据。例如,按照性别将人口分为男、女两类按照经济性质将企业分为国有、集体、私营、其他经济等。“男”、“女”,“国有”、“集体”、“私营”和“其他经济”就是分类数据。为了便于计算机处理,通常用数字代码来表述各个类别,比如,用1表示“男性”,0表示“女性”,但是1和0等只是数据的代码,它们之间没有数量上的关系和差异。

指反映事物类别的数据。如人按性别分为男、女两类。 分类数据(categorical data)是离散数据(discrete data)。分类属性具有有限个(但可能很多)不同值,值之间无序。例子包括地理位置、工作类别和商品类型。有很多方法产生分类数据的概念分层。

通过显式数据分组说明分层结构的一部分:这基本上是人工地定义概念分层结构的一部分。

分类数据代表着对象的属性特点。诸如人群的性别、语言、国籍大都属于分类数据。

分类数据通常也可以用数值表示(例如1表示女性而0表示男性),但需要注意的是这一数值并没有数学上的意义仅仅是分类的标记而已