当前位置: 代码网 > 科技>人工智能>机器学习 > 标准化、逻辑回归、随机梯度参数估计

标准化、逻辑回归、随机梯度参数估计

2024年08月02日 机器学习 我要评论
【代码】标准化、逻辑回归、随机梯度参数估计。

机器学习入门

数据预处理:

  1. 将?替换为缺失值
data = data.replace(to_replace="?",value=np.nan)
  1. 丢掉缺失值
data.dropna(how="any)
#how=all删除全是缺失值的行和列
#haow=any删除有缺失值的行和列
  1. 将数据集划分成测试集和训练集
    data[column_name[1:10]]是自变量x
    data[column_name[10]是因变量y
from sklearn.cross_validation import train_test_split
x_train,x_test,y_train,y_test=train_test_split(data[column_names[1:10]],data[column_
  1. 查看训练集、测试集分布
y_train.value_counts()
y_test.value_counts()
  1. 进行标准化,上一篇说了标准化是什么。
from sklearn.preprocessing import standardscaler
  1. 载入模型:逻辑回归(logistics),随机梯度参数估计(sgd)
# 逻辑回归
from sklearn.linear_model import logisticregression
# 随机梯度参数估计
from sklearn.linear_model import sgdclassifier
  1. 标准化
ss = standardscaler()
x_train = ss.fit_transform(x_train)
x_test = ss.fit_transform(x_test)
  1. 初始化模型
lr = logisticregression()
sgdc = sgdclassifier()
  1. 训练模型,预测模型
# 模型训练
lr.fit(x_train,y_train)
# 预测模型
lr_y_predict = lr.predict(x_test)
sgdc.fit(x_train,y_train)
sgdc_y_predict = sgdc.predict(x_test)
  1. 衡量指标
from sklearn.metrics import classification_report
  1. 准确度
print ('accuracy of lr classifier:',lr.score(x_test,y_test))
print ('accuracy of sgd classifier:',sgdc.score(x_test,y_test))
  1. 生成报告
print(classification_report(y_test,lr_y_predict,target_names=['benign','malignant']))
print(classification_report(y_test,sgdc_y_predict,target_names=['benign','malignant']))

在这里插入图片描述

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com