R语言选取两个不同年份随访的共同ID个案

发布时间 2023-08-31 17:13:30作者: sryjm

 

 

上面分别为基线2011年和2018年的随访数据,我们的目的是分析在基线2011年和2018年均有随访数据的ID,下面用R语言完成

library(foreign)
library(tidyverse)
data2011<-read.spss("C:/Users/Yan/Desktop/2011基本信息+体检问卷+健康状况和功能+血检数据+ID在十位上加0.sav",to.data.frame = T,use.value.labels = F)
data2018<-read.spss("C:/Users/Yan/Desktop/2018基本信息+健康状况和功能+认知和抑郁.sav",to.data.frame = T,use.value.labels = F)
# use.value.labels = F 是为了将变量的标签不导入到数据中
interID<-intersect(data2011$ID,data2018$ID)
class(data2011)
newdata2011<-data2011 %>% as_tibble() %>% filter(.,ID %in% interID)
newdata2018<-data2018 %>% as_tibble() %>% filter(.,ID %in% interID)
write.csv(newdata2011,"newdata2011.csv",row.names = F,na =".")
write.csv(newdata2018,"newdata2018.csv",row.names = F,na =".")
# na ="." 是为了将缺失值设置为"."