模型评估
1. Binary Evaluator
算法说明
用于评估二分类算法的预测结果。预测的结果必须是0~1的概率值,评估结果包括混淆矩阵和ROC/PR auc等指标。
输入
数据形式:Dense
格式:| label | score |
label:样本真实的label,通过参数中的标签列指定
score:预测值,模型预测的0~1.0之间的概率值所在的列,通过参数中的预测列指定
参数
标签列(labelCol):标签所在列,从0开始计数
预测列(scoreCol):预测值所在列,从0开始计数
预测阈值
范围:0~1.0的值,预测值大于该阈值,则预测为1;否则为0
说明:在真实的CTR预估中,预测的概率值都比较小,因此要视真实情况设定该参数
输出
True class和Hypothesized class的混淆矩阵
ROC/PR AUC值
2. Multi Evaluator
算法说明
用于评估多分类算法的预测结果。样本的预测结果是模型预测的类别;模块将会统计类别真实类列和预测类别的混淆矩阵和各个类别的f1,precision,recall。
输入
数据形式:Dense
格式:| label | predict |
label:样本真实的label,保存的是样本真实的类别,通过参数中的标签列指定
score:预测值,保存的是模型预测的类别,通过参数中的预测列指定
参数
标签列(labelCol):标签所在列,从0开始计数
预测列(predictCol):预测的类别所在列,从0开始计数
输出
True class和Hypothesized class的混淆矩阵
不同类别的f1, precision, recall。
3. Regression Evaluator
算法说明
用于评估回归算法的预测结果。输入的是真实的值和模型预测值;模型将计算MAE/MSE/rMAE/R2等指标。
输入
数据形式:Dense
格式:| label | predict |
说明:以空格连接各字段
label:样本真实的label,通过参数中的标签列指定
predict:预测值,通过参数中的预测列指定
参数
标签列(labelCol): 标签所在列,从0开始计数
预测列(scoreCol):预测值所在列,从0开始计数
输出
MAE/MSE/rMAE/R2等指标
Last updated
Was this helpful?