逻辑回归_机器学习_代码网手机版

#encoding=utf8
import numpy as np

def sigmoid(t):
    '''
    完成sigmoid函数计算
    :param t: 负无穷到正无穷的实数
    :return: 转换后的概率值
    :可以考虑使用np.exp()函数
    '''
    #********** begin **********#
    ans = 1/(1+np.exp(-t))
    return ans
    #********** end **********#

第2关：逻辑回归的损失函数

题目答案

第3关：梯度下降

编程要求

使用 python 实现梯度下降算法，并损失函数最小值时对应的参数theta，theta会返回给外部代码，由外部代码来判断theta是否正确。损失函数为：loss=2∗(θ−3) ，最优参数为：3.0 ，答案跟最优参数的误差低于0.0001才能通关。

代码文件

import numpy as np
import warnings
warnings.filterwarnings("ignore")

def gradient_descent(initial_theta,eta=0.05,n_iters=1000,epslion=1e-8):
    '''
    梯度下降
    :param initial_theta: 参数初始值，类型为float
    :param eta: 学习率，类型为float
    :param n_iters: 训练轮数，类型为int
    :param epslion: 容忍误差范围，类型为float
    :return: 训练后得到的参数
    '''
    #   请在此添加实现代码   #
    #********** begin *********#
    theta = initial_theta
    i_iters = 0
    while i_iters < n_iters:
        loss = 2*(theta-3)
        theta0 = theta
        theta = theta - eta*loss #权重
        if(abs(theta-theta0) < epslion):
            break
        i_iters += 1
    return theta
    #********** end **********#

第4关：动手实现逻辑回归 - 癌细胞精准识别

编程要求

构建一个逻辑回归模型，并对其进行训练，最后将得到的逻辑回归模型对癌细胞进行识别。只需返回预测结果即可，预测正确率高于 95% 视为过关。构建模型时 x0 是添加在数据的左边，请根据提示构建模型，且返回theta形状为(n,)，n为特征个数。

代码文件

import numpy as np
import warnings
warnings.filterwarnings("ignore")

def sigmoid(x):
    '''
    sigmoid函数
    :param x: 转换前的输入
    :return: 转换后的概率
    '''
    return 1/(1+np.exp(-x))


def fit(x,y,eta=1e-3,n_iters=10000):
    '''
    训练逻辑回归模型
    :param x: 训练集特征数据，类型为ndarray
    :param y: 训练集标签，类型为ndarray
    :param eta: 学习率，类型为float
    :param n_iters: 训练轮数，类型为int
    :return: 模型参数，类型为ndarray
    '''
    #   请在此添加实现代码   #
    #********** begin *********#
    theta = np.zeros(x.shape[1])
    i_iters = 0
    while i_iters < n_iters:
        loss = (sigmoid(x.dot(theta))-y).dot(x)
        theta = theta - eta*loss
        i_iters += 1
    return theta
    #********** end **********#

第5关：手写数字识别

编程要求

填写digit_predict(train_sample, train_label, test_sample)函数完成手写数字识别任务。

train_image：训练集图像，类型为ndarray，shape=[-1, 8, 8]；
train_label：训练集标签，类型为ndarray；
test_image：测试集图像，类型为ndarray。

只需返回预测结果即可，程序内部会检测您的代码，预测正确率高于 0.97 视为过关。

代码文件

from sklearn.linear_model import logisticregression

def digit_predict(train_image, train_label, test_image):
    '''
    实现功能：训练模型并输出预测结果
    :param train_sample: 包含多条训练样本的样本集，类型为ndarray,shape为[-1, 8, 8]
    :param train_label: 包含多条训练样本标签的标签集，类型为ndarray
    :param test_sample: 包含多条测试样本的测试集，类型为ndarry
    :return: test_sample对应的预测标签
    '''

    #************* begin ************#
    #数据预处理：使用min-max标准化
    trainimage = train_image.reshape((-1,64))
    train_min = trainimage.min()
    train_max = trainimage.max()
    trainimage = (trainimage-train_min)/(train_max-train_min)
    testimage = test_image.reshape((-1,64))
    test_min = testimage.min()
    test_max = testimage.max()
    testimage = (testimage-test_min)/(test_max-test_min)
    #训练预测
    logreg = logisticregression(c=10)
    logreg.fit(trainimage,train_label)
    result = logreg.predict(testimage)
    return result
    #************* end **************#

逻辑回归

第1关：逻辑回归核心思想

相关知识

什么是逻辑回归

编程要求

代码文件

第2关：逻辑回归的损失函数

相关知识

为什么需要损失函数

逻辑回归的损失函数

题目答案

第3关：梯度下降

相关知识

什么是梯度

梯度下降算法原理

编程要求

代码文件

第4关：动手实现逻辑回归 - 癌细胞精准识别

相关知识

数据集介绍

构建逻辑回归模型

训练逻辑回归模型

编程要求

代码文件

第5关：手写数字识别

相关知识

数据简介

logisticregression

编程要求

代码文件

推荐阅读

机器学习：逻辑回归

智能风控体系之逻辑回归

机器学习——逻辑回归

随机森林、逻辑回归、多层感知机和极端梯度提升（XGBoost）是四种常见的机器学习模型-代码模型评价可视化

最大似然估计和逻辑回归

机器学习个人作业：回归分析

猜你喜欢

发表评论