231
浏览3.3 技术工具与平台
3.3.1 数据处理工具
Python编程语言
Pandas数据框架
3.3.2 机器学习库
Scikit-learn
TensorFlow
3.3.3 数据可视化工具
Matplotlib
Seaborn
第4章 研究设计与方法
4.1 研究思路与框架
4.1.1 研究总体思路
从数据收集到模型验证的流程
4.1.2 研究流程设计
数据预处理
模型构建
模型评估
4.2 数据收集与预处理
4.2.1 数据来源与获取方式
学校管理系统数据
在线学习平台数据
4.2.2 数据清洗与缺失值处理
异常值检测
缺失值填补
4.2.3 数据规范化与特征工程
数据标准化
特征编码
4.3 模型构建方法
4.3.1 选择预测模型的依据
数据特征
预测目标
4.3.2 模型参数设置
超参数选择
参数调优方法
4.3.3 模型训练与优化
训练集与测试集划分
过拟合与欠拟合处理
4.4 模型评价指标
4.4.1 分类模型指标
准确率
F1-score
4.4.2 回归模型指标