特征工程-特征理解

  |   0 评论   |   18 浏览

特征理解

  1. 结构化vs非结构化

    1. 非结构化:服务器日志.原始文本格式存储的数据

    2. 结构化:行列结构

  2. 定量数据 vs 定性数据

    1. 定量是数值,衡量数量的

    2. 定性是累呗,描述性质

  3. 四个等级:定类、定序、定距、定比

    1. 定类:工作种类,动物物种,

    2. 定序:评分1-10,成绩A-F,工资水平,中位数,百分位,绘制茎叶图,箱线图

    3. 定距:数值之间的差异有意义,历年气温。均值 和标准差,滑动均值

    4. 定比:货币值、绝对零点

  4. 数据:

    1. 非结构化 :转换为结构化

    2. 结构化

      1. 识别每一列

        1. 定性

          1. 定类

          2. 定序

        2. 定量

          1. 定距

          2. 定比

    3. 可视化/描述性统计

  5. 理解数据的前提下,创造,修复,利用特征


标题:特征工程-特征理解
作者:lishulongVI
地址:https://blog.thinking.mobi/articles/2020/08/28/1598597057227.html

评论

发表评论