wenxiaopiao的个人博客分享 http://blog.sciencenet.cn/u/wenxiaopiao

博文

excel 导入SAS 出现问题 有些变量竟然是缺失的

已有 13473 次阅读 2011-8-23 16:39 |系统分类:科研笔记| SAS, 错误, 导入

 

       用的是SAS9.2这个版本,也不知道从哪里找来的,辛辛苦苦整理的数据,分析了超过一大半,有个变量的值非常奇怪,全是缺失的,返回原始excel查看,发现了一个让我泪奔的事实,从epidata导出的excel数据,然后再导入到SAS,这个的SAS有一部分记录的变量是缺失的,我在excel明明看看这个变量是存在的,清清楚楚明明白白是数字,结果SAS愣是空白的。一整列的变量都是缺失的,好几列的变量都是空白的,十分隐蔽。

       此次分析的数据量极大,过程相当复杂,耗费了本人很多的脑细胞,心灵上造成了极大的伤害。

为什么会出现这样的情况?

      1、 试过了,从epidata直接转换成SAS文件不会出现这样的问题。之前为什么从epidata导出成excel,是因为要在excel中做一些操作,删除巨多的重复项,要是能直接写命令,也就不用导出excel了,偶有只有这水平。

       2、自己在excel的第一行增加一条记录,每条记录上各个变量都填上数值,全填上0,再导入SAS,这次这个SAS又正常无比。

       血淋淋泪汪汪的教训:以后excel导入SAS要小心了,能直接epidata转换SAS就不搞那么多步骤了。excel导入SAS,管你个三七二十一,先增加一行,全部的变量都填上数字再导入。后面再删除这条记录就是了。

        为什么会出现这种情况呢?盗版软件?有谁知道到底是怎么回事?我很纳闷。

2012年2月补充:

By default the Import Wizard will scan the first 20 rows for delimited and the first 8 rows for Microsoft Excel files.If you have all missing data in these rows, or the data are not representative of the entire file, then the Import Wizard(and the IMPORT procedure) may not read the file correctly.    

使用IMPORT procedure: the XLS identifier looks at all rows in the file to determine the column type, wheras the EXCEL identifier only looks at the first 8 data rows by default.

《the  little sas book》four edition.P36. P64

至此,终于明白是怎么一回事了。

 



https://blog.sciencenet.cn/blog-501105-478701.html


下一篇:老师的短信
收藏 IP: 61.183.169.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-22 18:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部