一、逻辑回归算法?
逻辑回归其实是一个分类算法而不是回归算法。通常是利用已知的自变量来预测一个离散型因变量的值(像二进制值0/1,是/否,真/假)。简单来说,它就是通过拟合一个逻辑函数(logit fuction)来预测一个事件发生的概率。所以它预测的是一个概率值,自然,它的输出值应该在0到1之间。
假设你的一个朋友让你回答一道题。可能的结果只有两种:你答对了或没有答对。为了研究你最擅长的题目领域,你做了各种领域的题目。那么这个研究的结果可能是这样的:如果是一道十年级的三角函数题,你有70%的可能性能解出它。但如果是一道五年级的历史题,你会的概率可能只有30%。逻辑回归就是给你这样的概率结果。
逻辑回归的原理
Logistic Regression和Linear Regression的原理是相似的,可以简单的描述为这样的过程:
(1)找一个合适的预测函数(Andrew Ng的公开课中称为hypothesis),一般表示为h函数,该函数就是我们需要找的分类函数,它用来预测输入数据的判断结果。这个过程时非常关键的,需要对数据有一定的了解或分析,知道或者猜测预测函数的“大概”形式,比如是线性函数还是非线性函数。
(2)构造一个Cost函数(损失函数),该函数表示预测的输出(h)与训练数据类别(y)之间的偏差,可以是二者之间的差(h-y)或者是其他的形式。综合考虑所有训练数据的“损失”,将Cost求和或者求平均,记为J(θ)函数,表示所有训练数据预测值与实际类别的偏差。
(3)显然,J(θ)函数的值越小表示预测函数越准确(即h函数越准确),所以这一步需要做的是找到J(θ)函数的最小值。找函数的最小值有不同的方法,Logistic Regression实现时有的是梯度下降法(Gradient Descent)。
二、分层回归是逻辑回归吗?
不属于逻辑回归。
不属于,逻辑回归属于概率型的非线性回归,分为二分类和多分类的回归模型。分层回归的理解 其实是对两个或多个回归模型进行比较。分组数据的逻辑回归模型也可以称为分层逻辑回归。
分层回归将核心研究的变量放在最后一步进入模型,以考察在排除了其他变量的贡献的情况下,该变量对回归方程的贡献。如果变量仍然有明显的贡献,那么就可以做出该变量确实具有其他变量所不能替代的独特作用的结论。这种方法主要用于,当自变量之间有较高的相关,其中一个自变量的独特贡献难以确定的情况。常用于中介作用或者调节作用研究中。
三、进行逻辑回归需要数据归一化处理吗?
不需要
因为回归是探索因果关系,要保持原量纲信息。
不像做神经网络,需要归一化,消除量纲差异
四、什么叫逻辑回归数?
逻辑回归(Logistic Regression,也译作“对数几率回归”)是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。
五、逻辑回归模型建模步骤?
1,构建所需的数据集,根据实验的窗口,构建逻辑回归数据结构,例如 用过去12个月数据 做购买率的模型训练,这部分包含训练数据集与测试数据集,
2.变量的转化与预处理。
其中去掉缺失值较多的变量,购买率分布较集中的变量,即购买概率的变化不随自变量变化而变化的变量,即数值集中程度较高的变量。与Y不相关的变量。
3.变量的删选(特征工程)(caret包)
将高维即数量太庞大的自变量群,降维致较少的变量组合,(例如降至80以下 或者20左右),这部分步骤主要来降维的同时,期望消去变量之间的共线性,相关性等因素
4.模型的构建(glm 包/step() )
根据实际商业的目的,挑选第三步后剩下的变量,并调参,找到是整个系统平滑稳定的变量组合,例如10个变量,其中每个变量权重期望分布均匀,且满足模型其他各项基本指标,如C值 AUC等。
5.模型的评估 与描述
将构建完成的模型,将所有客户的购买率给出,并从高到低排序,总人群均分为10类 。输出模型结果 其中理想效果是 :购买率高的客户群为总体平均购买率人群的两倍既两倍以上,即高的购买率是总体平均购买率的两倍。
六、如何用SPSS二元logistic逻辑回归分析医学数据?
1、打开spss统计软件,依次点击“分析——回归——二元logistic”。
2、出现“logistic回归”窗口。
3、将“高血压”放入“因变量”框中,将变量“性别”、“体重指数”等其他变量放入“自变量”框中。
4、点击“分类”,将为分类变量的自变量放入右侧“分类协变量”框中,本案例的自变量“性别”、“饮食习惯、体育锻炼”等为分类变量,将这些分类的自变量选入右侧框中。
5、点击“保存”,勾选“概率”、“组成员”。
6、点击“选项”,勾选“霍斯默-莱梅肖拟合优度”和“95%的置信区间”。
7、方法”选择“输入”就行,最后“确定”。
七、逻辑回归与聚类区别?
逻辑回归是逻辑回归而聚类是聚类。
八、感知机与逻辑回归区别?
1、输出内容不一样
逻辑回归本质上是回归,回归是需要输出一个连续的数值,所以它寻求的是给定一个输入,正输出的概率。
而感知机则是用符号函数输出离散的值。
2、优化目标不一样
逻辑回归的loss function 是训练集上的极大似然函数。
感知机是误分数据点到分割超平面的距离的和。
因此优化目标不一样,前者是寻找参数最大化似然。后者是寻找参数最小化误分点到分割平面的距离。虽然都是用梯度下降。
九、逻辑回归基本原理?
逻辑回归本质上是线性回归,它在特征到结果的映射前添加一个激活模块,通常使用sigmoid激活函数,将线性回归的连续值结果映射到0-1之间,从而能够完成二分类任务。
十、逻辑回归如何得到预测值?
按照标准程序,需要将得出的各个参数代进回归方程中才能得出预测结果.不过,在SPSS中这个过程可以省略,而由SPSS代劳:在Logistic回归主对话框中点击Save键,在Predicted Values项下勾选Probabilities就可以自动为你生成每组的概率值;勾选Predicted Group Membership就可以自动为你生成应该进入的分类组,两者也可以同时选择,十分方便.