
一、数据的类型和特征
1.数值型数据:表示具体数值,可进行数学运算,如年龄、收入等。
2.分类型数据:表示某种类别或状态,不可进行数学运算,如性别、职业等。
3.有序型数据:表示具有一定顺序关系的数据,如学历的高低、产品的评分等。
4.时间型数据:表示时间的数据,如日期、时间戳等。
5.文本型数据:表示文字或字符串形式的数据,如评论、描述等。
二、数据的收集和整理
1.数据收集方法:包括问卷调查、观察、实验、采样等。
2.数据源的选择:根据需求选择合适的数据源,如数据库、文件、API等。
3.数据清洗:处理缺失值、异常值、重复值等问题,确保数据的准确性和完整性。
4.数据转换:对数据进行格式转换、单位转换等,以便进行后续分析。