当前位置：首页 > news >正文

Python----机器学习（基于PyTorch框架的逻辑回归）

news 2025/11/6 4:17:36

逻辑回归是一种广泛使用的统计学习方法，主要用于处理二分类问题。它基于线性回归模型，通过Sigmoid函数将输出映射到[0, 1]范围内，表示实例属于正类别的概率。尽管逻辑回归适用于二分类任务，但在多分类问题中常使用Softmax函数，它将多个类别的概率输出为和为1的正值，允许模型进行多类别预测。PyTorch是一个灵活且强大的深度学习框架，以其动态计算图和易用性受到广泛欢迎，适用于研究和生产环境中的各种机器学习任务。

一、sigmoid激活函数

1.1、输入散点

import numpy as npclass1_points = np.array([[1.9, 1.2],[1.5, 2.1],[1.9, 0.5],[1.5, 0.9],[0.9, 1.2],[1.1, 1.7],[1.4, 1.1]])class2_points = np.array([[3.2, 3.2],[3.7, 2.9],[3.2, 2.6],[1.7, 3.3],[3.4, 2.6],[4.1, 2.3],[3.0, 2.9]])
x_train = np.concatenate((class1_points, class2_points))
y_train = np.concatenate((np.zeros(len(class1_points)), np.ones(len(class2_points))))

1.2、转换为Tensor张量

import torch
inputs=torch.tensor(x_train,dtype=torch.float32)
labels=torch.tensor(y_train,dtype=torch.float32).unsqueeze(1)

1.3、定义模型

import torch
import torch.nn as nn
torch.manual_seed(42)
class LogisticRegreModel(nn.Module):def __init__(self,inputsizes):super().__init__()self.linear=nn.Linear(inputsizes,1)def forward(self,x):return torch.sigmoid(self.linear(x))
model=LogisticRegreModel(x_train.shape[1])

1.4、定义损失函数和优化器

from torch.optim import SGD
cri=torch.nn.BCELoss()
optimizer=SGD(model.parameters(),lr=0.05)

1.5、开始迭代

for i in range(1,1001):output=model(inputs)loss=cri(output,labels)optimizer.zero_grad()loss.backward()optimizer.step()if i%100==0 or i==1:print(i,loss.item())

1.6、可视化

from matplotlib import pyplot as plt
fig,(ax1,ax2)=plt.subplots(1,2)
epoch_list=[]
loss_list=[]for i in range(1,1001):inputs=torch.tensor(x_train,dtype=torch.float32)labels=torch.tensor(y_train,dtype=torch.float32).unsqueeze(1)output=model(inputs)loss=cri(output,labels)optimizer.zero_grad()loss.backward()optimizer.step()if i%100==0 or i==1:print(i,loss.item())w1,w2=model.linear.weight.data.flatten()b=model.linear.bias.data[0]slope=-w1/w2intercept=-b/w2x_min,x_max=0,5x=np.array([x_min,x_max])y=slope*x+interceptax1.clear()ax1.scatter(class1_points[:,0],class1_points[:,1])ax1.scatter(class2_points[:,0],class2_points[:,1])ax1.plot(x,y)ax2.clear()epoch_list.append(i)loss_list.append(loss.item())ax2.plot(epoch_list,loss_list)
plt.show()

1.7、完整代码

import numpy as np  # 导入 NumPy 库以进行数组和数学运算  
from matplotlib import pyplot as plt  # 导入 Matplotlib 库以绘制图形  
import torch  # 导入 PyTorch 库  
import torch.nn as nn  # 导入 PyTorch 的神经网络模块  
from torch.optim import SGD  # 导入随机梯度下降优化器  # 定义类1的数据点  
class1_points = np.array([[1.9, 1.2],  [1.5, 2.1],  [1.9, 0.5],  [1.5, 0.9],  [0.9, 1.2],  [1.1, 1.7],  [1.4, 1.1]])  # 定义类2的数据点  
class2_points = np.array([[3.2, 3.2],  [3.7, 2.9],  [3.2, 2.6],  [1.7, 3.3],  [3.4, 2.6],  [4.1, 2.3],  [3.0, 2.9]])  # 合并类1和类2的数据点，作为训练特征  
x_train = np.concatenate((class1_points, class2_points))  
# 合并类1和类2的标签，类1为 0，类2为 1  
y_train = np.concatenate((np.zeros(len(class1_points)), np.ones(len(class2_points))))  # 将训练特征和标签转换为 PyTorch 张量  
inputs = torch.tensor(x_train, dtype=torch.float32)  
labels = torch.tensor(y_train, dtype=torch.float32).unsqueeze(1)  # 设置随机种子以便复现结果  
torch.manual_seed(42)  # 定义逻辑回归模型类  
class LogisticRegreModel(nn.Module):  def __init__(self, input_sizes):  super().__init__()  # 继承父类的初始化方法  self.linear = nn.Linear(input_sizes, 1)  # 定义线性层，输入大小为 input_sizes，输出为 1  def forward(self, x):  return torch.sigmoid(self.linear(x))  # 前向传播，应用 Sigmoid 函数  # 实例化逻辑回归模型，输入特征的维度为 x_train 的列数  
model = LogisticRegreModel(x_train.shape[1])  # 定义二元交叉熵损失函数  
cri = torch.nn.BCELoss()  
# 使用随机梯度下降算法作为优化器  
optimizer = SGD(model.parameters(), lr=0.05)  # 创建子图用于展示  
fig, (ax1, ax2) = plt.subplots(1, 2)  
epoch_list = []  # 存储每次训练的epoch数  
loss_list = []   # 存储每次训练的损失值  # 训练模型，进行 1000 次迭代  
for i in range(1, 1001):  inputs = torch.tensor(x_train, dtype=torch.float32)  # 再次定义输入张量  labels = torch.tensor(y_train, dtype=torch.float32).unsqueeze(1)  # 再次定义标签张量  output = model(inputs)  # 前向传播计算模型输出  loss = cri(output, labels)  # 计算损失值  optimizer.zero_grad()  # 清空之前的梯度  loss.backward()  # 反向传播计算梯度  optimizer.step()  # 更新参数  # 每 100 次迭代打印损失并更新图形  if i % 100 == 0 or i == 1:  print(i, loss.item())  # 打印当前epoch和损失值  # 获取当前模型参数  w1, w2 = model.linear.weight.data.flatten()  # 权重参数  b = model.linear.bias.data[0]  # 偏置参数  # 计算决策边界的斜率和截距  slope = -w1 / w2  intercept = -b / w2  x_min, x_max = 0, 5  # 决定x轴的范围  x = np.array([x_min, x_max])  # 创建x值的数组  y = slope * x + intercept  # 根据斜率和截# 根据斜率和截距计算决策边界的y值  y = slope * x + intercept  ax1.clear()  # 清空第一张子图  # 绘制类1和类2的数据点  ax1.scatter(class1_points[:, 0], class1_points[:, 1], color='blue', label='Class 1')  ax1.scatter(class2_points[:, 0], class2_points[:, 1], color='orange', label='Class 2')  # 绘制当前的决策边界  ax1.plot(x, y, color='green', label='Decision Boundary')  ax1.legend()  # 显示图例  ax2.clear()  # 清空第二张子图  epoch_list.append(i)  # 将当前epoch添加到列表  loss_list.append(loss.item())  # 将当前损失值添加到列表  ax2.plot(epoch_list, loss_list, color='red')  # 绘制损失变化曲线  # 显示绘制的图形  
plt.show()

二、Softmax激活函数

2.1、输入散点

import numpy as npclass1_points = np.array([[1.9, 1.2],[1.5, 2.1],[1.9, 0.5],[1.5, 0.9],[0.9, 1.2],[1.1, 1.7],[1.4, 1.1]])class2_points = np.array([[3.2, 3.2],[3.7, 2.9],[3.2, 2.6],[1.7, 3.3],[3.4, 2.6],[4.1, 2.3],[3.0, 2.9]])
x_train = np.concatenate((class1_points, class2_points))
y_train = np.concatenate((np.zeros(len(class1_points)), np.ones(len(class2_points))))

2.2、转换为Tensor张量

import torch
inputs=torch.tensor(x_train,dtype=torch.float32)
labels=torch.tensor(y_train,dtype=torch.long)

2.3、定义模型

class LogisticRegreModel(torch.nn.Module):def __init__(self):super(LogisticRegreModel, self).__init__()self.fc = torch.nn.Linear(2, 2)def forward(self, x):x = self.fc(x)# dim 指定了softmax在哪个维度上进行# dim = 1第二个维度上进行，列# example：x  (sample， num_classes)# torch.softmax(x, dim=1), pytorch在每个样本上的类别进行softmax，保证每个样本的所有类别的概率和为1。return torch.softmax(x, dim=1)model = LogisticRegreModel()

2.4、定义损失函数和优化器

cri = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.05)

2.5、开始迭代

for epoch in range(1, 1001):outputs = model(inputs)loss = cri(outputs, labels)optimizer.zero_grad()loss.backward()optimizer.step()if epoch % 50 == 0 or epoch == 1:print(f"epoch: {epoch}, loss: {loss}")

2.6、可视化

plt.figure(figsize=(12, 6))xx, yy = np.meshgrid(np.arange(0, 6, 0.1), np.arange(0, 6, 0.1))
grid_points = np.c_[xx.ravel(), yy.ravel()]epoches = 1000
for epoch in range(1, epoches + 1):outputs = model(inputs)loss = cri(outputs, labels)optimizer.zero_grad()loss.backward()optimizer.step()if epoch % 50 == 0 or epoch == 1:print(f"epoch: {epoch}, loss: {loss}")grid_tensor = torch.tensor(grid_points, dtype=torch.float32)Z = model(grid_tensor).detach().numpy()Z = Z[:, 1]Z = Z.reshape(xx.shape)plt.cla()plt.scatter(class1_points[:, 0], class1_points[:, 1])plt.scatter(class2_points[:, 0], class2_points[:, 1])plt.contour(xx, yy, Z, levels=[0.5])plt.pause(1)plt.show()

2.7、完整代码

import numpy as np  # 导入 NumPy 库进行数组和数学运算  
import torch  # 导入 PyTorch 库  
import matplotlib.pyplot as plt  # 导入 Matplotlib 用于绘图  # 定义类1的数据点  
class1_points = np.array([[1.9, 1.2],  [1.5, 2.1],  [1.9, 0.5],  [1.5, 0.9],  [0.9, 1.2],  [1.1, 1.7],  [1.4, 1.1]])  # 定义类2的数据点  
class2_points = np.array([[3.2, 3.2],  [3.7, 2.9],  [3.2, 2.6],  [1.7, 3.3],  [3.4, 2.6],  [4.1, 2.3],  [3.0, 2.9]])  # 合并类1和类2的数据点，作为训练特征  
x_train = np.concatenate((class1_points, class2_points))  
# 合并类1和类2的标签，类1为 0，类2为 1  
y_train = np.concatenate((np.zeros(len(class1_points)), np.ones(len(class2_points))))  # 将训练特征和标签转换为 PyTorch 张量  
inputs = torch.tensor(x_train, dtype=torch.float32)  # 输入特征  
labels = torch.tensor(y_train, dtype=torch.long)  # 标签应为长整型  # 定义逻辑回归模型类  
class LogisticRegreModel(torch.nn.Module):  def __init__(self):  super(LogisticRegreModel, self).__init__()  # 继承父类的初始化方法  self.fc = torch.nn.Linear(2, 2)  # 定义线性层，输入大小为 2，输出类别数为 2  def forward(self, x):  x = self.fc(x)  # 进行前向传播，计算线性层输出  # 使用 softmax 函数将输出转换为概率  return torch.softmax(x, dim=1)  # dim=1 表示在列上进行 softmax 操作  # 实例化逻辑回归模型  
model = LogisticRegreModel()  # 定义交叉熵损失函数，适用于多分类问题  
cri = torch.nn.CrossEntropyLoss()  
# 定义优化器为随机梯度下降  
optimizer = torch.optim.SGD(model.parameters(), lr=0.05)  # 创建绘图窗口  
plt.figure(figsize=(12, 6))  # 创建网格点用于绘制决策边界  
xx, yy = np.meshgrid(np.arange(0, 6, 0.1), np.arange(0, 6, 0.1))  # 生成网格坐标  
grid_points = np.c_[xx.ravel(), yy.ravel()]  # 将网格点展平为 (样本数, 特征数) 的形式  epoches = 1000  # 定义训练的轮数  
for epoch in range(1, epoches + 1):  outputs = model(inputs)  # 前向传播获得模型输出  loss = cri(outputs, labels)  # 计算损失  optimizer.zero_grad()  # 清空之前的梯度  loss.backward()  # 反向传播计算梯度  optimizer.step()  # 更新模型参数  # 每 50 个 epoch 更新绘图  if epoch % 50 == 0 or epoch == 1:  print(f"epoch: {epoch}, loss: {loss.item()}")  # 打印当前 epoch 和损失值  grid_tensor = torch.tensor(grid_points, dtype=torch.float32)  # 将网格点转换为张量  Z = model(grid_tensor).detach().numpy()  # 前向传播获得每个网格点的输出  Z = Z[:, 1]  # 取出第二类的概率，用于绘制决策边界  Z = Z.reshape(xx.shape)  # 重塑为网格形状  plt.cla()  # 清除当前图形  plt.scatter(class1_points[:, 0], class1_points[:, 1], label='Class 1')  # 绘制类1数据点  plt.scatter(class2_points[:, 0], class2_points[:, 1], label='Class 2')plt.contour(xx, yy, Z, levels=[0.5])plt.legend()plt.pause(1)plt.show()

查看全文

http://www.dtcms.com/a/136941.html