R语言进行Twitter数据可视化( 二 )
文章插图
根据图1 , 我们可以得出结论 , 通过数据抓取(关键字“Jokow Widodo”和“Prabowo Subianto”)得到的tweet数量并不相似 , 即使在同一日期 。
例如 , 在图1(左)中 , 从视觉上看 , 对于关键字为“Joko Widodo”的推文 , 仅在2019年5月28日03:00–17:00 WIB期间获得 。 而在图1(右图)中 , 我们得出的结论是 , 在2019年5月28日至29日12:00-23:59 WIB(2019年5月28日)和00:00-15:00 WIB(2019年5月29日)期间获得的关键词为“Prabowo Subianto”的推文 。
# 2019-05-28的推特ggplot(data.hour.date1)+geom_bar(aes(x = Hour,y = Total.Tweets,fill = I('red')),stat = 'identity',alpha = 0.75,show.legend = FALSE)+geom_hline(yintercept = mean(data.hour.date1$Total.Tweets),col = I('black'),size = 1)+geom_text(aes(fontface = 'italic',label = paste('Average:',ceiling(mean(data.hour.date1$Total.Tweets)),'Tweets per hour'),x = 6.5,y = mean(data.hour.date1$Total.Tweets)+5),hjust = 'left',size = 4)+labs(title = 'Total Tweets per Hours - Prabowo Subianto',subtitle = '28 May 2019',caption = 'Twitter Crawling 28 - 29 May 2019')+xlab('Time of Day')+ylab('Total Tweets')+ylim(c(0,100))+theme_bw()+scale_fill_brewer(palette = 'Dark2')# 2019-05-29的推特ggplot(data.hour.date2)+geom_bar(aes(x = Hour,y = Total.Tweets,fill = I('red')),stat = 'identity',alpha = 0.75,show.legend = FALSE)+geom_hline(yintercept = mean(data.hour.date2$Total.Tweets),col = I('black'),size = 1)+geom_text(aes(fontface = 'italic',label = paste('Average:',ceiling(mean(data.hour.date2$Total.Tweets)),'Tweets per hour'),x = 1,y = mean(data.hour.date2$Total.Tweets)+6),hjust = 'left',size = 4)+labs(title = 'Total Tweets per Hours - Prabowo Subianto',subtitle = '29 May 2019',caption = 'Twitter Crawling 28 - 29 May 2019')+xlab('Time of Day')+ylab('Total Tweets')+ylim(c(0,100))+theme_bw()+scale_fill_brewer(palette = 'Dark2')
文章插图
根据图2 , 我们得到了使用关键字“Joko Widodo”和“Prabowo Subianto”的用户之间的显著差异 。 关键词为“Joko Widodo”的tweet在某个特定时间(07:00–09:00 WIB)谈论Joko Widodo往往非常激烈 , 08:00 WIB的tweet数量最多 。 它有348条推文 。 然而 , 在2019年5月28日至29日期间 , 关键词为“Prabowo Subianto”的推文往往会不断地谈论Prabowo Subianto 。 2019年5月28日至29日 , 每小时上传关键词为“Prabowo Subianto”的推文平均为36条 。
# JOKO WIDODOdf.score.1 = subset(senti.jokowi,class == c('Negative','Positive'))colnames(df.score.1) = c('Score','Text','Sentiment')# Data vizggplot(df.score.1)+geom_density(aes(x = Score,fill = Sentiment),alpha = 0.75)+xlim(c(-11,11))+labs(title = 'Density Plot of Sentiment Scores',subtitle = 'Joko Widodo',caption = 'Twitter Crawling 28 - 29 May 2019')+xlab('Score')+ylab('Density')+theme_bw()+scale_fill_brewer(palette = 'Dark2')+theme(legend.position = 'bottom',legend.title = element_blank())# PRABOWO SUBIANTOdf.score.2 = subset(senti.prabowo,class == c('Negative','Positive'))colnames(df.score.2) = c('Score','Text','Sentiment')ggplot(df.score.2)+geom_density(aes(x = Score,fill = Sentiment),alpha = 0.75)+xlim(c(-11,11))+labs(title = 'Density Plot of Sentiment Scores',subtitle = 'Prabowo Subianto',caption = 'Twitter Crawling 28 - 29 May 2019')+xlab('Density')+ylab('Score')+theme_bw()+scale_fill_brewer(palette = 'Dark2')+theme(legend.position = 'bottom',legend.title = element_blank())
推荐阅读
- 大一非计算机专业的学生,如何利用寒假自学C语言
- 微软|外媒:微软将对Windows 10界面进行彻底改进 已招兵买马
- Linux 5.11开始围绕PCI Express 6.0进行早期准备
- AMP Robotics募资5500万美元 开发AI对可回收物进行分拣
- Mozilla正在对Firefox设计进行更新工作
- 为什么我喜欢C语言,却非常讨厌C++?一位国外程序员的回答
- iPhone 13仍将有四款型号 Pro版屏幕进行重大升级
- 谷歌对内部论文进行“敏感问题”审查!讲坏话的不许发
- Java语言会不会随着容器的兴起而衰落
- 大数据专业本科生选择主攻Python语言,如何提升就业竞争力