js如何算auc

JS如何算AUC，使用预测概率、实际标签、计算ROC曲线下的面积。

AUC（Area Under Curve，曲线下面积）是评估二分类模型性能的重要指标之一。具体来说，AUC衡量的是ROC曲线下的面积，ROC曲线展示了分类器在各种阈值下的性能。为了在JavaScript中计算AUC，可以使用预测概率和实际标签，并计算ROC曲线下的面积。下面我们将详细讨论如何在JavaScript中实现这一过程。

一、AUC与ROC曲线的基础概念

AUC是ROC（Receiver Operating Characteristic）曲线下面积的缩写。ROC曲线是通过改变分类模型的决策阈值来绘制的，它展示了模型的真正例率（True Positive Rate，TPR）与假正例率（False Positive Rate，FPR）之间的关系。AUC值越接近1，表示模型的性能越好。以下是一些基本概念：

TPR（真正例率）：TPR = TP / (TP + FN)
FPR（假正例率）：FPR = FP / (FP + TN)

在计算AUC之前，我们需要先计算出这些值，并生成ROC曲线。

二、数据准备

在开始计算AUC之前，我们需要准备两个数组：一个包含预测概率（predictedProbabilities），另一个包含实际标签（actualLabels）。假设我们有以下数据：

const predictedProbabilities = [0.9, 0.8, 0.4, 0.6, 0.2];
const actualLabels = [1, 1, 0, 1, 0];

三、计算TPR和FPR

为了计算TPR和FPR，我们需要遍历不同的阈值，并计算每个阈值下的TPR和FPR。可以将预测概率按降序排列，并使用每个概率作为阈值来计算。

function calculateTprFpr(predictedProbabilities, actualLabels) {
    const thresholds = Array.from(new Set(predictedProbabilities)).sort((a, b) => b - a);
    const tprFpr = [];
    thresholds.forEach((threshold) => {
        let tp = 0, fp = 0, fn = 0, tn = 0;
        for (let i = 0; i < predictedProbabilities.length; i++) {
            if (predictedProbabilities[i] >= threshold) {
                if (actualLabels[i] === 1) {
                    tp++;
                } else {
                    fp++;
                }
            } else {
                if (actualLabels[i] === 1) {
                    fn++;
                } else {
                    tn++;
                }
            }
        }
        const tpr = tp / (tp + fn);
        const fpr = fp / (fp + tn);
        tprFpr.push([fpr, tpr]);
    });
    return tprFpr;
}
const tprFpr = calculateTprFpr(predictedProbabilities, actualLabels);

四、计算AUC

通过梯形法则，我们可以计算ROC曲线下的面积，即AUC值。具体来说，我们将ROC曲线分成若干小梯形，并计算每个梯形的面积，然后求和。

function calculateAUC(tprFpr) {
    let auc = 0;
    for (let i = 1; i < tprFpr.length; i++) {
        const xDiff = tprFpr[i][0] - tprFpr[i - 1][0];
        const ySum = tprFpr[i][1] + tprFpr[i - 1][1];
        auc += xDiff * ySum / 2;
    }
    return auc;
}
const auc = calculateAUC(tprFpr);
console.log(`AUC: ${auc}`);

五、总结

通过以上步骤，我们可以在JavaScript中计算AUC值。首先，我们准备预测概率和实际标签，然后计算出不同阈值下的TPR和FPR，最后使用梯形法则计算AUC值。以下是完整的代码：

const predictedProbabilities = [0.9, 0.8, 0.4, 0.6, 0.2];
const actualLabels = [1, 1, 0, 1, 0];
function calculateTprFpr(predictedProbabilities, actualLabels) {
    const thresholds = Array.from(new Set(predictedProbabilities)).sort((a, b) => b - a);
    const tprFpr = [];
    thresholds.forEach((threshold) => {
        let tp = 0, fp = 0, fn = 0, tn = 0;
        for (let i = 0; i < predictedProbabilities.length; i++) {
            if (predictedProbabilities[i] >= threshold) {
                if (actualLabels[i] === 1) {
                    tp++;
                } else {
                    fp++;
                }
            } else {
                if (actualLabels[i] === 1) {
                    fn++;
                } else {
                    tn++;
                }
            }
        }
        const tpr = tp / (tp + fn);
        const fpr = fp / (fp + tn);
        tprFpr.push([fpr, tpr]);
    });
    return tprFpr;
}
function calculateAUC(tprFpr) {
    let auc = 0;
    for (let i = 1; i < tprFpr.length; i++) {
        const xDiff = tprFpr[i][0] - tprFpr[i - 1][0];
        const ySum = tprFpr[i][1] + tprFpr[i - 1][1];
        auc += xDiff * ySum / 2;
    }
    return auc;
}
const tprFpr = calculateTprFpr(predictedProbabilities, actualLabels);
const auc = calculateAUC(tprFpr);
console.log(`AUC: ${auc}`);

通过这种方法，你可以在JavaScript中计算AUC值，从而评估二分类模型的性能。

相关问答FAQs：

如何使用JavaScript计算AUC？

什么是AUC？ AUC（Area Under the Curve）是用于衡量分类模型性能的指标，代表ROC曲线下的面积。AUC值越大，模型的性能越好。
如何计算AUC？ 在JavaScript中，可以使用一些常见的数据科学库（如scikit-learn.js）来计算AUC。首先，需要准备好模型预测的概率或得分以及真实标签的数据。然后，使用库中的相关函数来计算AUC值。
示例代码：

// 假设有一个预测概率数组preds和真实标签数组labels
const preds = [0.2, 0.6, 0.8, 0.4, 0.9];
const labels = [0, 1, 1, 0, 1];

// 使用scikit-learn.js计算AUC
const { roc_auc_score } = require('scikit-learn');

const auc = roc_auc_score(labels, preds);
console.log('AUC:', auc);

这段代码使用scikit-learn.js库中的roc_auc_score函数来计算AUC值。首先，将预测的概率数组和真实标签数组作为参数传入该函数，然后将计算得到的AUC值打印出来。

注意：在使用这些库之前，需要先安装并导入相应的依赖。

希望以上解答对您有帮助！如有更多问题，请随时提问。

文章包含AI辅助创作，作者：Edit2，如若转载，请注明出处：https://docs.pingcode.com/baike/2467180