" id="b1img" alt="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" title="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO">
  • " alt="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" title="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" />
  • " alt="Windows/Linux服务器运维技术支持 环境搭建、应用发布、服务器管理、虚拟化、云计算" title="Windows/Linux服务器运维技术支持 环境搭建、应用发布、服务器管理、虚拟化、云计算" />
  • " alt="高校/小型企业网络运维与建设免费技术支持,网络规划、网络优化、故障排除、网络管理" title="高校/小型企业网络运维与建设免费技术支持,网络规划、网络优化、故障排除、网络管理" />
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工——我的数据分析之路(十)假设检验

2018-06-18 itlogger阅读(891) 评论(0)
假设检验——批判性思维 1.假设检验步骤 (1)问题是什么? 零假设/备选假设:零假设(虚无假设)是做统计检验时的一类假设。零假设的内容一般是希望证明其错误的假设。与零假设相对的是备选假设(对立假设) 检测类型 抽样分布类型:大样本(正态分布),小样本(t分布),其他 检验方向 (2)证据是什么?零假设成立时,得到样本平均值的概率P (3)判...
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工——我的数据分析之路(九)抽样分布与估计

itlogger阅读(805) 评论(0)
1. 什么是总体和抽样 总体是指考察的对象的全体 个体是总体中的每一个考察的对象 样本是总体中所抽取的一部分个体 样本大小(容量)则是指样本中个体的数目 抽样分布:样本平均值的分布可视化 2. 什么是中心极限定理 (1)样本的均值约等于总体平均值 (2)不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的平均值范围,并呈正...
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工——我的数据分析之路(八)概率分布

itlogger阅读(788) 评论(0)
1.随机变量 一个量化随机时间的函数,代表每一个可能出现的试验结果的数值,f(x)>0,∑f(x)=1 离散随机变量、连续随机变量 2.概率分布 分布指在统计图中的形状,概率分布=随机变量+概率+分布,用于表述随机变量取值的概率规律 离散型概率分布关注的是某个特定值的概率 连续型概率分布关注的是某个范围的概率 3.离散概率分布 3.1 伯努利分布 Ber...
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工——我的数据分析之路(七)数据可视化分析(共享单车案例)

itlogger阅读(1,161) 评论(0)
【共享单车数据可视化分析】 1.项目简介   共享单车服务一种新型的交通工具分时租赁业务,主要依靠载体为自行车,整个租赁过程(获得会员资格、租赁和自行车返回的过程)通过城市的亭站网络自动进行,在最大化利用了公共道路利用率的同时,也能起到健身的作用。   共享单车系统生成的数据对研究人员很有吸引力, 因为旅行...
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工——我的数据分析之路(六)机器学习入门(案例实战)

2018-05-20 itlogger阅读(864) 评论(0)
案例实战——《kaggle泰坦尼克号预测》 0.kaggle简介 Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。 Kaggle 竞赛了分成几个类别。最常见的类别是: Featured:这些通常是由公司、组织甚至政府赞助的,奖...
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工——我的数据分析之路(五)机器学习入门(逻辑回归分类)

itlogger阅读(837) 评论(0)
1.分类问题的本质 其本质是构造一个函数,将连续型变量映射成离散型变量。 2.训练数据和测试数据 a) 训练数据:训练数据是用来学习模型的。训练数据的质量对生成一个成功的机器学习模型来说至关重要,理想的训练数据应该是多样化并尽可能与模型需要用到的特性相关的。 b) 测试数据:被用来对生成的模型的准确度进行评估的数据。测试数据不能...
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工——我的数据分析之路(四)机器学习入门(简单线性回归)

2018-05-19 itlogger阅读(887) 评论(0)
1.什么是机器学习         机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。         机器学习主要的工作就是提取出有用的特征(比如卖西瓜的人的性别这个特征对...
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工,数据分析之路(三)——利用Python进行数据分析

2018-05-16 itlogger阅读(770) 评论(0)
一、数据分析的基本过程 提出问题 理解数据(采集数据、导入数据、查看数据集信息) 数据清洗:数据预处理(选择子集、列名重命名、缺失数据处理、数据类型转换、数据排序、异常值处理) 构建模型:业务指标、机器学习算法训练 数据可视化:图表 二、Python数据分析基础知识 1.常用的两个包Numpy、Pandas(带有索引) 2.基本函数 data.shape: ...
<a href="http://www.itlogger.com/category/res" rel="category tag">资源分享</a>
资源分享

别了网工,数据分析之路(二)——描述统计学/概率基础

2018-05-14 itlogger阅读(608) 评论(0)
一、描述统计学基础 1.什么是描述统计学 描述统计学是一种数据归纳的方法,通常以表格、图形或数值这种易于理解的形式进行数据汇总。 2.常用的数值表示法 2.1 位置度量 (1)平均数 平均数对于异常值不敏感 (2)中位数 先从小到大排序,如果数量N是奇数则取中间这个数作为中位数,如果是偶数个,则取中间两个数的均值。 (3)四分位 下界、Q...