精通混淆矩阵：机器学习从业者的全面指南

什么是混淆矩阵？
混淆矩阵的组成部分
- 真阳性 (TP)
- 真阴性 (TN)
- 假阳性 (FP)
- 假阴性 (FN)
理解多类别的混淆矩阵
使用 Scikit-Learn 构建混淆矩阵
可视化混淆矩阵
解释模型性能指标
- 准确率
- 精确率
- 召回率
- F1 分数
- 特异性
高级：处理多类别混淆矩阵
基于天气预测数据集的实用实现
结论

什么是混淆矩阵？

混淆矩阵是分类模型性能的表格化表示。它通过将实际目标值与模型预测值进行比较，帮助您直观地了解模型的表现。矩阵的每一行代表实际类别中的实例，而每一列代表预测类别中的实例，反之亦然。这种结构不仅使您能够识别模型所犯错误的类型，还能了解这些错误的频率。

图1：混淆矩阵的基本结构。

混淆矩阵的组成部分

理解混淆矩阵的各个组成部分对于有效解释结果至关重要。矩阵由四个关键指标组成：

真阳性 (TP)

定义：正确分类为阳性的实例数量。
示例：如果模型预测明天会下雨，且实际上确实下雨，则为真阳性。

真阴性 (TN)

定义：正确分类为阴性的实例数量。
示例：如果模型预测明天不会下雨，且实际上确实不会下雨，则为真阴性。

假阳性 (FP)

定义：错误分类为阳性的实例数量。
示例：如果模型预测明天会下雨，但实际上并未下雨，则为假阳性。这也称为第一类错误。

假阴性 (FN)

定义：错误分类为阴性的实例数量。
示例：如果模型预测明天不会下雨，但实际上确实下雨，则为假阴性。这也称为第二类错误。

图2：混淆矩阵中 TP、TN、FP 和 FN 的细分。

理解多类别的混淆矩阵

虽然二分类涉及两个类别（正类和负类），但多类别分类扩展了混淆矩阵以适应更多类别。例如，在一个包含三个类别——山鸢尾（setosa）、杂色鸢尾（versicolor）和维吉尼卡鸢尾（virginica）的数据集中，混淆矩阵变为一个 3×3 的网格。每一行代表实际类别，每一列代表预测类别。对角线元素仍然代表正确的预测，而非对角线元素则表示各种类型的误分类。

图3：多类别混淆矩阵的示例。

使用 Scikit-Learn 构建混淆矩阵

Python 的 scikit-learn 库提供了强大的工具来生成和分析混淆矩阵。以下是使用 scikit-learn 构建混淆矩阵的分步指南，并辅以一个实用示例。

步骤 1：导入必要的库

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, OneHotEncoder, StandardScaler
from sklearn.metrics import confusion_matrix, plot_confusion_matrix, accuracy_score
from sklearn.linear_model import LogisticRegression
import matplotlib.pyplot as plt

import pandas as pd

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import LabelEncoder, OneHotEncoder, StandardScaler

from sklearn.metrics import confusion_matrix, plot_confusion_matrix, accuracy_score

from sklearn.linear_model import LogisticRegression

import matplotlib.pyplot as plt

步骤 2：加载和准备数据集

为了演示，我们将使用澳大利亚天气数据集。

# Load the dataset
data = pd.read_csv('weatherAUS.csv')

# Define features and target variable
X = data.iloc[:, :-1]
y = data.iloc[:, -1]

# Handle missing data
from sklearn.impute import SimpleImputer
import numpy as np

# Numeric features
numerical_cols = X.select_dtypes(include=['int64', 'float64']).columns
imp_mean = SimpleImputer(missing_values=np.nan, strategy='mean')
X[numerical_cols] = imp_mean.fit_transform(X[numerical_cols])

# Categorical features
string_cols = X.select_dtypes(include=['object']).columns
imp_mode = SimpleImputer(missing_values=np.nan, strategy='most_frequent')
X[string_cols] = imp_mode.fit_transform(X[string_cols])

# Encoding categorical variables
X = pd.get_dummies(X, drop_first=True)

# Encode target variable
le = LabelEncoder()
y = le.fit_transform(y)

# Load the dataset

data = pd.read_csv('weatherAUS.csv')

# Define features and target variable

X = data.iloc[:, :-1]

y = data.iloc[:, -1]

# Handle missing data

from sklearn.impute import SimpleImputer

import numpy as np

# Numeric features

numerical_cols = X.select_dtypes(include=['int64', 'float64']).columns

imp_mean = SimpleImputer(missing_values=np.nan, strategy='mean')

X[numerical_cols] = imp_mean.fit_transform(X[numerical_cols])

# Categorical features

string_cols = X.select_dtypes(include=['object']).columns

imp_mode = SimpleImputer(missing_values=np.nan, strategy='most_frequent')

X[string_cols] = imp_mode.fit_transform(X[string_cols])

# Encoding categorical variables

X = pd.get_dummies(X, drop_first=True)

# Encode target variable

le = LabelEncoder()

y = le.fit_transform(y)

步骤 3：拆分数据集

# Split into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.20, random_state=1
)

# Split into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(

X, y, test_size=0.20, random_state=1

)

步骤 4：特征缩放

# Standardize the features
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Standardize the features

scaler = StandardScaler()

X_train = scaler.fit_transform(X_train)

X_test = scaler.transform(X_test)

步骤 5：训练分类模型

我们将使用逻辑回归作为示例。

# Initialize and train the model
model = LogisticRegression(random_state=0, max_iter=200)
model.fit(X_train, y_train)

# Make predictions
y_pred = model.predict(X_test)

# Initialize and train the model

model = LogisticRegression(random_state=0, max_iter=200)

model.fit(X_train, y_train)

# Make predictions

y_pred = model.predict(X_test)

步骤 6：生成混淆矩阵

# Calculate accuracy
accuracy = accuracy_score(y_pred, y_test)
print(f'Accuracy: {accuracy:.4f}')

# Generate confusion matrix
cm = confusion_matrix(y_test, y_pred)
print('Confusion Matrix:')
print(cm)

# Calculate accuracy

accuracy = accuracy_score(y_pred, y_test)

print(f'Accuracy: {accuracy:.4f}')

# Generate confusion matrix

cm = confusion_matrix(y_test, y_pred)

print('Confusion Matrix:')

print(cm)

输出：

Accuracy: 0.8297
Confusion Matrix:
[[21087  1058]
 [ 3786  2508]]

Accuracy: 0.8297

Confusion Matrix:

[[21087 1058]

[ 3786 2508]]

可视化混淆矩阵

可视化有助于直观理解模型的性能。Scikit-learn 提供了内置函数，可以轻松绘制混淆矩阵。

# Plot confusion matrix
plot_confusion_matrix(model, X_test, y_test, display_labels=le.classes_)
plt.title('Confusion Matrix')
plt.show()

# Plot confusion matrix

plot_confusion_matrix(model, X_test, y_test, display_labels=le.classes_)

plt.title('Confusion Matrix')

plt.show()

图4：使用 scikit-learn 可视化混淆矩阵。

解释模型性能指标

除了准确率之外，混淆矩阵还允许计算其他多个性能指标：

准确率

定义：正确分类的实例占总实例数的比例。
公式： \[ \text{准确率} = \frac{TP + TN}{TP + TN + FP + FN} \]
解释：尽管有用，但在不平衡数据集中，准确率可能会产生误导。

精确率

定义：正确预测为正类的观察值占所有预测为正类的观察值的比例。
公式： \[ \text{精确率} = \frac{TP}{TP + FP} \]
解释：高精确率表示算法返回的相关结果远多于不相关的结果。

召回率 (敏感性)

定义：正确预测为正类的观察值占所有实际正类观察值的比例。
公式： \[ \text{召回率} = \frac{TP}{TP + FN} \]
解释：高召回率表示算法返回了大部分相关结果。

F1 分数

定义：精确率和召回率的加权平均。
公式： \[ F1 = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} \]
解释：F1 分数传达了精确率和召回率之间的平衡。

特异性

定义：正确预测为负类的观察值占所有实际负类观察值的比例。
公式： \[ \text{特异性} = \frac{TN}{TN + FP} \]
解释：高特异性表示模型能够有效识别负类案例。

高级：处理多类别混淆矩阵

在有多个类别的情境下，混淆矩阵扩展为多维网格。每个对角线元素代表每个类别的正确分类实例，而非对角线元素则表示各种误分类。

示例： 考虑一个包含 A、B 和 C 类的三类别分类问题。

               Predicted
               A    B    C
Actual A      50     2     3
       B       5    45     5
       C       2     3    48

Predicted

A B C

Actual A 50 2 3

B 5 45 5

C 2 3 48

类 A 的真阳性：50
类 A 的假阳性：5 (来自 B) + 2 (来自 C) = 7
类 A 的假阴性：2 (到 B) + 3 (到 C) = 5
类 A 的真阴性：总数 – (TP + FP + FN) = 100 – (50 + 7 + 5) = 38

Scikit-learn 的 confusion_matrix 函数能够无缝处理多类别情境，提供一个清晰的矩阵，便于详细的性能分析。

基于天气预测数据集的实用实现

为了巩固这些概念，让我们通过一个使用澳大利亚天气数据集的实际示例来演练。本数据集涉及基于各种天气属性预测第二天是否会下雨。

分步实现

数据预处理：
- 使用 SimpleImputer 处理缺失值。
- 使用独热编码编码分类变量。
- 使用 LabelEncoder 编码目标变量。
特征缩放：
- 标准化特征，以确保每个特征对模型性能的贡献相等。
模型训练：
- 训练多个分类模型，如 K 近邻、逻辑回归、高斯朴素贝叶斯、支持向量机、决策树、随机森林、AdaBoost 和 XGBoost。
评估：
- 计算每个模型的准确率。
- 生成并可视化混淆矩阵，以了解预测的分布。

示例代码片段

训练逻辑回归模型：

from sklearn.linear_model import LogisticRegression

# Initialize the model
LRM = LogisticRegression(random_state=0, max_iter=200)

# Train the model
LRM.fit(X_train, y_train)

# Predict on test data
y_pred = LRM.predict(X_test)

# Evaluate accuracy
print(accuracy_score(y_pred, y_test))

from sklearn.linear_model import LogisticRegression

# Initialize the model

LRM = LogisticRegression(random_state=0, max_iter=200)

# Train the model

LRM.fit(X_train, y_train)

# Predict on test data

y_pred = LRM.predict(X_test)

# Evaluate accuracy

print(accuracy_score(y_pred, y_test))

输出：

0.8296705228735187

1	0.8296705228735187

生成混淆矩阵：

from sklearn.metrics import confusion_matrix, plot_confusion_matrix

# Compute confusion matrix
cm = confusion_matrix(y_test, y_pred)
print(cm)

# Plot confusion matrix
plot_confusion_matrix(LRM, X_test, y_test, display_labels=le.classes_)
plt.title('Logistic Regression Confusion Matrix')
plt.show()

from sklearn.metrics import confusion_matrix, plot_confusion_matrix

# Compute confusion matrix

cm = confusion_matrix(y_test, y_pred)

print(cm)

# Plot confusion matrix

plot_confusion_matrix(LRM, X_test, y_test, display_labels=le.classes_)

plt.title('Logistic Regression Confusion Matrix')

plt.show()

输出：

[[21087  1058]
 [ 3786  2508]]

1 2	[[21087 1058] [ 3786 2508]]

图5：逻辑回归模型的混淆矩阵。

多个模型的比较准确率：

from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier
import xgboost as xgb

# Initialize models
models = {
    'KNN': KNeighborsClassifier(n_neighbors=3),
    'Logistic Regression': LogisticRegression(random_state=0, max_iter=200),
    'GaussianNB': GaussianNB(),
    'SVC': SVC(),
    'Decision Tree': DecisionTreeClassifier(),
    'Random Forest': RandomForestClassifier(n_estimators=500, max_depth=5),
    'AdaBoost': AdaBoostClassifier(),
    'XGBoost': xgb.XGBClassifier(use_label_encoder=False, eval_metric='mlogloss')
}

# Train and evaluate models
for name, model in models.items():
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    accuracy = accuracy_score(y_pred, y_test)
    print(f'{name} Accuracy: {accuracy:.4f}')

from sklearn.neighbors import KNeighborsClassifier

from sklearn.naive_bayes import GaussianNB

from sklearn.svm import SVC

from sklearn.tree import DecisionTreeClassifier

from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier

import xgboost as xgb

# Initialize models

models = {

'KNN': KNeighborsClassifier(n_neighbors=3),

'Logistic Regression': LogisticRegression(random_state=0, max_iter=200),

'GaussianNB': GaussianNB(),

'SVC': SVC(),

'Decision Tree': DecisionTreeClassifier(),

'Random Forest': RandomForestClassifier(n_estimators=500, max_depth=5),

'AdaBoost': AdaBoostClassifier(),

'XGBoost': xgb.XGBClassifier(use_label_encoder=False, eval_metric='mlogloss')

}

# Train and evaluate models

for name, model in models.items():

model.fit(X_train, y_train)

y_pred = model.predict(X_test)

accuracy = accuracy_score(y_pred, y_test)

print(f'{name} Accuracy: {accuracy:.4f}')

示例输出：

KNN Accuracy: 0.8003
Logistic Regression Accuracy: 0.8297
GaussianNB Accuracy: 0.7960
SVC Accuracy: 0.8282
Decision Tree Accuracy: 0.8302
Random Forest Accuracy: 0.8302
AdaBoost Accuracy: 0.8299
XGBoost Accuracy: 0.8302

KNN Accuracy: 0.8003

Logistic Regression Accuracy: 0.8297

GaussianNB Accuracy: 0.7960

SVC Accuracy: 0.8282

Decision Tree Accuracy: 0.8302

Random Forest Accuracy: 0.8302

AdaBoost Accuracy: 0.8299

XGBoost Accuracy: 0.8302

从输出可以看出，决策树、随机森林和 XGBoost 模型表现出最高的准确率，其次是逻辑回归和 AdaBoost。

结论

混淆矩阵是评估分类模型性能的不可或缺的工具。它们提供了模型在不同类别上的详细表现视图，突出模型的优势和需要改进的地方。通过掌握混淆矩阵的构建和解释，以及精确率、召回率和 F1 分数等补充指标，机器学习从业者可以开发出更健壮和可靠的模型。利用像 scikit-learn 这样的工具简化了这一过程，使模型评估和迭代改进更加高效。在您继续探索和实施机器学习模型时，将混淆矩阵整合到您的评估流程中，必将提升您的分析能力和模型效能。

有关更详细的示例和高级技术，请参阅 scikit-learn 上的混淆矩阵文档。

WordPress-specific instructions: 1. Translate ONLY the text content, NOT any HTML tags or WordPress blocks 2. Preserve ALL WordPress HTML formatting including:

,

, , , , , ,  tags
3. DO NOT translate any code snippets, variable names, function names, or HTML tags
4. Maintain ALL table structures exactly as they appear
5. Keep all WordPress block comments ( etc.) exactly as they are
6. Preserve ALL HTML attributes (style, border, etc.)
7. Return the complete WordPress-compatible article with 100% identical HTML structure

Translation:

（译文如上）		

		
		
					
		
			分享你的喜爱
			
							
				
					
					
								
							
				
					
					
								
							
				
					
					
								
							
				
					
					
								
			
			
					

			
		
		
							
					
					
						
							上一页 文章						

													
								S26L03 - 准确率、精确率、召回率、特异性、F1分数							
											

				
			
							
					
						
							下一页 文章						

													
								S27L01 - 分类模型主模板							
											

									
			
		

	
	

	
			English
	हिन्दी
	Español
	中文 (中国)
	Português
	한국어


Recent Posts


S15L02 – 调整后的 R 平方
S15L01 – R平方
S41L01 – DeepSpeech 概述
S40L12 – 一个简单的数字分类器
S40L11 – 反向传播



Categories


	Hibernate Articles (zh)

	Java Articles (zh)

	Java Content

	JavaScript Articles (zh)

	JSP And Servlets Articles (zh)

	machine-leaning-articles-zh

	react-framework (zh)

	Restful API Overview Articles (zh)

	Spring Articles (zh)

	Spring Boot Articles (zh)

	Spring Boot RESTFUL API Articles (zh)



			

	

	


	© 2025 - StudyEasy.org



	StudyEasy On Udemy
Privacy Policy
Terms Of Service
Refund Policy
About
support

S26L04 – 三维混淆矩阵

精通混淆矩阵：机器学习从业者的全面指南

目录

什么是混淆矩阵？

混淆矩阵的组成部分

真阳性 (TP)

真阴性 (TN)

假阳性 (FP)

假阴性 (FN)

理解多类别的混淆矩阵

使用 Scikit-Learn 构建混淆矩阵

步骤 1：导入必要的库

步骤 2：加载和准备数据集

步骤 3：拆分数据集

步骤 4：特征缩放

步骤 5：训练分类模型

步骤 6：生成混淆矩阵

可视化混淆矩阵

解释模型性能指标

准确率

精确率

召回率 (敏感性)

F1 分数

特异性

高级：处理多类别混淆矩阵

基于天气预测数据集的实用实现

分步实现

示例代码片段

训练逻辑回归模型：

生成混淆矩阵：

多个模型的比较准确率：

结论

,

,