知识试读

数据挖掘神器——NHANES数据库

2021-11-16  本文已影响0人  科研侠

01

引言

你还在为数据挖掘发愁吗?这里我们给大家推荐一个非常好用的数据库—NHANES。要做研究,就需要数据;NHANES数据库,官网直接免费下载!NHANES数据库初次使用者可以在官网导航栏中获取网站简介,受调者筛选,调查手册,数据获取,数据使用及分析方法等。下面是NHANES的功能简介和数据提取的基本流程,小伙伴们按需选取。

02

NHANES数据库简介

首先我们先来了解下NHANES这个数据库,NHANES是比较知名的公共数据库,国家健康和营养检查调查 (NHANES,National Health and Nutrition Examination Survey) 是一项基于人群的横断面调查,旨在收集美国成人和儿童的健康和营养状况的信息,该调查的独特之处在于它结合了访谈和体检。该数据库包括Demog Data(人口统计学数据)、Dietary Data(饮食数据)、 Examination Data(检查数据)、Laboratory Data(实验室数据)、Questionnaire Data(问卷数据)、Limited Access Data(有限访问数据)。调查结果将用于确定主要疾病的患病率和疾病的风险因素,也是衡量身高、体重和血压等国家标准的基础。

 NHANES 数据库拥有庞大的数据资源,并且完全开放免费下载,而且这个数据库每两年更新一次,会加入大把新数据,完全不担心样本量不够。当然介绍的再多都不如自己去网站逛一逛。

03

NHANES 数据库如何挖?

1、登入网站:打开网页首页https://www.cdc.gov/nchs/nhanes/index.htm

2、选择数据集:点击左侧导航栏中的Questionnaires,Datasets,and Related

Documentation(问卷数据)。

3、选择数据年份:在这里我们以2017-2018年的数据为例,虽然2019-2020年份已经存在,但是2019-2020的数据还未整理完成。

4、选择需要的数据:在“Data,Documentation, Codebooks”一项中,有6项不同的数据,分别是“Demographics Data”(人口数据)、 “Dietary Data”(饮食数据)、“Examination Data”(检查数据)、“Laboratory Data”(实验室数据)、“Questionnaire Data”(问卷数据)、 “Limited Access Data”(限制访问数据)。这里 我们以“Demographics Data为例,明确如何应用。

5、理解数据变量:点击“DEMO_I Doc查看各个变量代表的是什么,如:种族。

6.下载数据:返回上一页,点击“DEMO_I Data [XPT - 3.3 MB]下载数据,该数据为XPT格式,XPT格式的文件用Excel是查看不了的,我们可以导入到R语言中,使用R Studio查看,我们一般是转换成CSV格式进行查看并将其导出。

04

小结

目前用NHANES里的数据发表的文章有五万多篇,只要我们肯去挖掘,发SCI就不是什么大问题。如果大家感兴趣,可以去多读一些由NHANES数据库发表的文章获得灵感。当然,NHANES里的数据是美国人的,不能外推到其他国家的人。希望这些分享能对做科研的小伙伴有所帮助,至少不再为数据资源和样本发愁。

参考文献:

[1]郭晓娟,田国祥,潘振宇,杨津,柳青青,吕军.NHANES项目介绍及数据提取流程[J].中国循证心血管医学杂志,2019,11(06):654-657.

END

文 | Angel

上一篇 下一篇

猜你喜欢

热点阅读