R里面怎样将字符串变量转换成虚拟变量

文本格式的数据源可以用 data.table 的 fread读入,然后用模型拟合,拟合时注意用 factor 来构建 dummy variable.下面是随机生成的一些数据:数据中有两列数字 x y 还有两列字符串要作为dummy variable,其中gender取值为F, M, 而 type 取值为A,B,C.\u0026gt; dt \u0026lt;- data.table(x=rnorm(100),y=rnorm(100),gender=sample(c("F","M"),100,T),type=sample(c("A","B","C"),100,T))\u0026gt; lm(y~x+factor(gender)+factor(type),data=https://www.zhihu.com/api/v4/questions/24467614/dt)Call:lm(formula = y ~ x + factor(gender) + factor(type), data = dt)Coefficients: (Intercept) x factor(gender)M factor(type)B 0.18753 -0.04641 -0.35910 -0.01910 factor(type)C -0.01337 至于 formula 怎么用更方便,可以参见我的 gitbook: Formula | learnR


    推荐阅读