当前位置: 首页 > wzjs >正文

frontpg做网站好吗百度网站认证

frontpg做网站好吗,百度网站认证,网络系统的价值跟用户数量成正比,怎样创建网站视频机器学习管道 pipeline 一般通用pipeline的实现流程: 1.构建多个转换器(transformer),来实现对特征的预处理 2.构建 ColumnTransformer,将不同的预处理应用于不同的列子集,构造一个完备的转化器 3.构建…

机器学习管道 pipeline

一般通用pipeline的实现流程:

1.构建多个转换器(transformer),来实现对特征的预处理

2.构建 ColumnTransformer,将不同的预处理应用于不同的列子集,构造一个完备的转化器

3.构建完整的 Pipeline,将预处理器和模型串联起来

通用pipeline

如果要实现一个简单的适用于所有机器学习模型的pipeline,我觉得可以通过类的封装来实现:

具体代码实例如下:

from sklearn.pipeline import Pipeline
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import StandardScaler, OneHotEncoder, OrdinalEncoder
from sklearn.impute import SimpleImputer
import pandas as pd
from sklearn.model_selection import train_test_splitclass GenericPipelineBuilder:#构造函数传入需要的参数,包括模型,数值特征,适合进行独热编码的特征,适合进行序数编码的特征,指定每个序数编码特征的类别顺序列表def __init__(self, model, numeric_features, onehot_features, ordinal_features, ordinal_categories=None):self.model = modelself.numeric_features = numeric_featuresself.onehot_features = onehot_featuresself.ordinal_features = ordinal_featuresself.ordinal_categories = ordinal_categories if ordinal_categories else [[] for _ in range(len(ordinal_features))]# 构建数值特征的处理管道,包括缺失值填充和标准化def build_numeric_transformer(self):return Pipeline(steps=[('imputer', SimpleImputer(strategy='mean')),('scaler', StandardScaler())])# 构建适合进行独热编码的特征的处理管道,包括缺失值填充和独热编码def build_onehot_transformer(self):return Pipeline(steps=[('imputer', SimpleImputer(strategy='most_frequent')),('onehot', OneHotEncoder(handle_unknown='ignore', sparse_output=False))])# 构建适合进行序数编码的特征的处理管道,包括缺失值填充和序数编码def build_ordinal_transformer(self):return Pipeline(steps=[('imputer', SimpleImputer(strategy='most_frequent')),('ordinal', OrdinalEncoder(categories=self.ordinal_categories, handle_unknown='use_encoded_value',unknown_value=-1))])# 构建整个预处理的ColumnTransformer,将不同的特征处理管道应用到不同的特征def build_preprocessor(self):return ColumnTransformer(transformers=[('num', self.build_numeric_transformer(), self.numeric_features),('onehot', self.build_onehot_transformer(), self.onehot_features),('ordinal', self.build_ordinal_transformer(), self.ordinal_features)],remainder='passthrough')# 构建完整的机器学习流水线,包括预处理和模型def build_pipeline(self):return Pipeline(steps=[('preprocessor', self.build_preprocessor()),('classifier', self.model)])

使用的话直接实例化类进行操作即可

例子如下:

    data = pd.read_csv('your_data.csv')y = data['target_column']X = data.drop('target_column', axis=1)X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)numeric_features = X.select_dtypes(include=['number']).columns.tolist()onehot_features = ['Color', 'City']ordinal_features = ['Education_Level']ordinal_categories = [['High School', 'Bachelor', 'Master', 'PhD']]from sklearn.ensemble import RandomForestClassifiermodel = RandomForestClassifier(random_state=42)builder = GenericPipelineBuilder(model, numeric_features, onehot_features, ordinal_features, ordinal_categories)pipeline = builder.build_pipeline()pipeline.fit(X_train, y_train)print("模型训练完成")

@浙大疏锦行

http://www.dtcms.com/wzjs/3997.html

相关文章:

  • 吴江区桃源镇做网站关键词指数批量查询
  • 外贸网站装修外贸营销网站
  • 沧州网站建设外贸网络推广图片
  • 网站演示网站代码自己怎么开网站
  • 北京顺义区住房和城乡建设委员会网站进一步优化落实
  • 做网站公司 包含了服务器费用吗杭州优化外包哪里好
  • 政府类网站制作怎么seo网站关键词优化
  • 律师做网络推广最好的网站有哪些免费b站软件推广网站
  • wordpress时间代码福州seo技术培训
  • wordpress做定制T恤的网站全达seo
  • 网站主页调用世界杯比分
  • 化妆品公司的网站建设的利益分析网上怎么推销自己的产品
  • 手机网站做多少钱营销技巧和营销方法视频
  • 用html建设网站近日发生的重大新闻
  • 免费云建站郑州做网站推广
  • 新疆建设安监局网站查询seo外贸网站制作
  • 让百度收录网站百seo排名优化
  • 专业外贸网站建设 诚信 青岛青岛seo软件
  • 温州 建网站的公司广告优化师的工作内容
  • 精品课程网站建设的背景及意义中文域名注册官网入口
  • 网站seo模块哈尔滨百度搜索排名优化
  • 30天网站建设实录西安做seo的公司
  • 做外贸的网站看啥书东莞网站seo优化
  • 校园加盟网站建设链接检测工具
  • 专业的led网站建设网站域名怎么查询
  • wordpress仿凡客商城主题西安搜索引擎优化
  • 免费海报制作网站济南网络优化哪家专业
  • 网站伪静态cps推广
  • 秀洲区住房和城乡建设局网站网站推广和精准seo
  • 做线上网站需要多少钱网站推广做什么