谁说菜鸟不会数据分析-程序员宅基地

技术标签: Excel  

第四章 数据处理

4.2 数据清洗

1.重复数据处理

  • 筛选重复数据:(1)函数法:对 =COUNTIF(A:A, A2)  =COUNTIF(A$2:A2, A2) 粗体部分不理解;(2)高级筛选法;(3)条件格式法:对重复值进行标记;(4)数据透视表法:用数据透视表标记重复出现的次数。
  • 删除重复数据:(1)法一 菜单操作删除:选中区域--“数据”选项卡--“数据工具”--“删除重复项”;(2)法二 排序删除:没搞定!!;(3)法三 筛选删除法;

2.缺失数据处理

  • 定位输入("Ctrl+G"快捷键):(1)缺失数据处理四种方法:a.样本平均值代替;b.统计模型拟合代替;c.删除;d.缺失值记录保留,仅在分析中删除。(2)"Ctrl+Enter"快捷键:用于在不连续区域中同时输入同一个数据或公式。选中所有目标单元格--在其中一个输入内容--"Ctrl+Enter"
  • 查找替换:(1)查找快捷键"Ctrl+F";(2)替换快捷键"Ctrl+H"。

3.检查逻辑错误(第一种 被调查者输入选项不符要求;第二种 录入错误)

  • 利用IF函数检查错误:(1)IF函数 IF(logical_test,value_if_true,value_if_false);(2)示例  =IF(COUNTIF(B3:H3, "<>0")>3,"错误","正确")-----(COUNTIF  对指定条件 "<>0"单元格B3:H3进行计数,勿忘"<>0"的双引号)
  • 利用条件格式(OR、AND)标记错误:(1)OR/AND(logical1,logical2,...) (2)示例  =OR(B3=1,B3=0)=FALSE

4.3数据加工

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_41895921/article/details/84994954

智能推荐

常用博客API-程序员宅基地

文章浏览阅读438次。Pjblog:Movable Typehttp://你的Blog根目录/xmlrpc.asp 已测试i170:MetaWeblog APIhttp://www.i170.com/user/你的i170的用户名mydonews:http://my.donews.com/yourname/xmlrpc.phpCSDN:Metaweblog APIhttp://blog.csdn.net/services/metablogapi.aspx 已测试Live spaces:Metaweblog API _博客api

基于HTML5的可预览多图片Ajax上传_function html5reader(file,pic,addimg,deleteimg){-程序员宅基地

文章浏览阅读2.8k次。基于HTML5的可预览多图片Ajax上传by zhangxinxu from http://www.zhangxinxu.com本文地址:http://www.zhangxinxu.com/wordpress/?p=1923一、关于图片上传什么什么的在XHTML的时代,我们使用HTML file控件上传图片一次只能上传一张。要一次上传多图,做法是借助于flash。例如swf_function html5reader(file,pic,addimg,deleteimg){

计算机专业动手能力表现,计算机专业学生程序设计动手能力的培养-程序员宅基地

文章浏览阅读391次。程序设计能力是计算机专业学生应具有的非常重要的、基本的的技能之一,计算机专业学生在程序设计上动手能力差有多方面原因,针对这些原因.应在学生学习的积极性、教学计划、学习方法、教学方法、考核模式等方面改进培养办法。维普资讯 http://doc.xuehai.net20 0 6年 8月十堰职业技术学院学报J u n l fS ia c nc l n t u e o r a h y nTe h ia..._女生被说动手能力差在计算机专业上可能

PATL1-002打印沙漏_l1-002 打印沙漏(php版)-程序员宅基地

文章浏览阅读201次。L1-002打印沙漏(20分)本题要求你写个程序把给定的符号打印成沙漏的形状。例如给定17个“*”,要求按下列格式打印***** *** * ********所谓“沙漏形状”,是指每行输出奇数个符号;各行符号中心对齐;相邻两行符号数差2;符号数先从大到小顺序递减到1,再从小到大顺序递增;首尾符号数相等。给定任意N个符号,不一定能正好组成一个沙漏。要求打印出的沙漏..._l1-002 打印沙漏(php版)

依赖注入的三种实现方式?_依赖注入是通过什么方式实现的?-程序员宅基地

文章浏览阅读192次。依赖注入的三种实现方式?构造器注入,Setter方法注入,接口注入_依赖注入是通过什么方式实现的?

如果你想写自己的Benchmark框架_自己做一个benchmark-程序员宅基地

文章浏览阅读1.2w次,点赞4次,收藏3次。使用过JMH的同学一定会惊叹它的神奇。JMH作为一个优秀的Benchmark框架带给了我们无数的欢乐。作为一个有极客精神的程序员,那么有没有想过去自己实现一个Benchmark框架呢?在实现Benchmark框架的时候有需要注意些什么问题呢?快来一起看看吧。_自己做一个benchmark

随便推点

再看SLA文档_李晓瑞_廊坊师范提高班十五期_新浪博客-程序员宅基地

文章浏览阅读69次。1.传统外语学习的误区?a)要有语言环境,多跟外国人交流,最好是能出国,不久自然就能会说了。b)学习外语要多记多背,也就是说是用记忆学语言。c)想纠正发音,一定要专听和模仿纯正的发音,比如BBC或VOA那种。d)要学习外语语法,如果语法熟练,说句子就正确了。e)...

购物车结算用java写_用 JavaScript 模拟购物车的结算功能-程序员宅基地

文章浏览阅读632次。各位小伙伴娜娜又来了今天我们来模仿一个购物车实现结算功能购物车先来看一下成品的页面效果,原谅我这只有猫的照片,要是放点猫粮,猫砂什么的~会不会有打广告的嫌疑~请点击此处输入图片描述就是这个样子的,现在我们来动手做一下。先来写页面的布局,这边我们使用 ul 列表来做这个布局,一共是六个 ul,其中我们需要写样式的就只有三个(表头,中间内容,结尾),中间的四块是一样的样式可以直接复制。总体布局:请点击..._使用java在页面输入数量,单价,运费后点击合计按钮计算购物车中的交易费用

Wireshark TCP报文到达ACK确认机制_whireshark ack-程序员宅基地

文章浏览阅读6.7k次,点赞2次,收藏12次。Wireshark TCP报文到达ACK确认机制_whireshark ack

AndroidStudio安装与配置_怎么样安装androud studio-程序员宅基地

文章浏览阅读642次。最近准备学习下安卓,这不,第一步安装工具Android Studio,这里简单记录下.首先建议各种工具的下载地址,首选AndroidStudio中文社区http://tools.android-studio.org/index.php/85-tools/109-android-tools-download (推荐网盘下载,方便快捷,还可以自己备份一份;官网下载需要翻墙,不友好)1.安装jd_怎么样安装androud studio

Atomic Integer 原理分析-getAndAddInt-程序员宅基地

文章浏览阅读487次。通过do/while循环,基于CAS乐观锁来做原子递增。实际上前面的valueOffset的作用就是从主内存中获得当前value的值和预期值做一个比较,如果相等,对value做递增并结束循环public final int getAndAddInt(Object var1, long var2, int var4) { int var5; do { var5 = this.getIntVolatile(var1, var2); } while(!this.compareAndSwap_getandaddint

MATLAB 主要函数指令表(按功能分类,转) _exponential zero-state response by lsim-程序员宅基地

文章浏览阅读1.4k次。在网上查资料的时候百出来的,感觉还不错,先放这里了,有时间好好研究下http://i.cn.yahoo.com/zlg246/blog/p_1/原帖就不知道是哪的了 最近学习,经常用到matlab命令,就收集了一下,以方面学习,呵呵1 常用指令(General Purpose Commands)1.1 通用信息_exponential zero-state response by lsim