我想在不同的列中重新编码多个值。
例如:
df <- data.frame(wave = c(1,1,1,1,1,1,2,2,2,2,2,2),
party = rep(c("A", "A", "A", "B", "B", "B"), 2),
s_item = rep(c(3,4,5,1,2,6), 2),
s_item2 = rep(c(1,2,3,4,5,6), 2),
s_item3 = rep(c(6,2,3,1,5,4), 2))
数据:
wave party s_item s_item2 s_item3
1 1 A 3 1 6
2 1 A 4 2 2
3 1 A 5 3 3
4 1 B 1 4 1
5 1 B 2 5 5
6 1 B 6 6 4
7 2 A 3 1 6
8 2 A 4 2 2
9 2 A 5 3 3
10 2 B 1 4 1
11 2 B 2 5 5
12 2 B 6 6 4
对于所有的"s_“列,我希望将值"1,2,3,4,5,6”重新编码为"-1,-0.5,0,0.5,1,NA“。
所以,我需要的是:
wave party s_item s_item2 s_item3
1 1 A 0.0 -1.0 NA
2 1 A 0.5 -0.5 -0.5
3 1 A 1.0 0.0 0.0
4 1 B -1.0 0.5 -1.0
5 1 B -0.5 1.0 1.0
6 1 B NA NA 0.5
7 2 A 0.0 -1.0 NA
8 2 A 0.5 -0.5 -0.5
9 2 A 1.0 0.0 0.0
10 2 B -1.0 0.5 -1.0
11 2 B -0.5 1.0 1.0
12 2 B NA NA 0.5
这适用于单个值:
for(i in df %>% select(starts_with("s_")) %>% colnames()){
df[[i]] <- replace(df[[i]], df[[i]] %in% 1, -1)
}
但这是行不通的:
for(i in df %>% select(starts_with("s_")) %>% colnames()){
df[[i]] <- replace(df[[i]], df[[i]] %in% 1, -1,
df[[i]], df[[i]] %in% 2, -0.5,
df[[i]], df[[i]] %in% 3, 0,
df[[i]], df[[i]] %in% 4, 0.5,
df[[i]], df[[i]] %in% 5, 1,
df[[i]], df[[i]] %in% 6, NA,)
}
有没有一种方法可以像我在上面的代码中想象的那样,在单个循环中做到这一点?我也对不同的策略持开放态度,只要代码尽可能紧凑。
转载请注明出处:http://www.hnsdbxf.com/article/20230526/2298748.html