R语言进行Twitter数据可视化( 四 ) 概述对于这个项目

文章插图
图4是包含关键字“Joko Widodo”和“Prabowo Subianto”的情感得分密度图。 tweets的得分是由组成tweets的词根的平均得分得到的。因此，它的分数是针对每个词根给出的，其值介于-10到10之间。如果分数越小，那么微博中的负面情绪就越多，反之亦然。根据图4（左），可以得出结论，包含关键字“Joko Widodo”的推文的负面情绪在-10到-1之间，中间得分为-4 。它也适用于积极的情绪（当然，有一个积极的分数）。根据图4（左）中的密度图，我们发现积极情绪的得分具有相当小的方差。因此，我们得出结论，对包含关键词“Joko Widodo”的微博的积极情绪并不是太多样化。
图4（右）显示了包含关键字“Prabowo Subianto”的情感得分密度图。它与图4（左）不同，因为图4（右）上的负面情绪在-8到-1之间。这意味着tweets没有太多负面情绪（tweets有负面情绪，但不够高）。此外，负面情绪得分的分布在4和1之间有两个峰值。然而，积极情绪从1到10不等。与图4（左）相比，图4（右）的积极情绪具有较高的方差，在3和10范围内有两个峰值。这表明，包含关键词“Prabowo Subianto”的微博具有很高的积极情绪。
# JOKO WIDODOdf.senti.3 = as.data.frame(table(senti.jokowi$class))colnames(df.senti.3) = c('Sentiment','Freq')# 数据预处理df.pie.1 = df.senti.3df.pie.1$Prop = df.pie.1$Freq/sum(df.pie.1$Freq)df.pie.1 = df.pie.1 %>%arrange(desc(Sentiment)) %>%mutate(lab.ypos = cumsum(Prop) - 0.5*Prop)# 数据可视化ggplot(df.pie.1,aes(x = 2,y = Prop,fill = Sentiment))+geom_bar(stat = 'identity',col = 'white',alpha = 0.75,show.legend = TRUE)+coord_polar(theta = 'y',start = 0)+geom_text(aes(y = lab.ypos,label = Prop),color = 'white',fontface = 'italic',size = 4)+labs(title = 'Piechart of Sentiments',subtitle = 'Joko Widodo',caption = 'Twitter Crawling 28 - 29 May 2019')+xlim(c(0.5,2.5))+theme_void()+scale_fill_brewer(palette = 'Dark2')+theme(legend.title = element_blank(),legend.position = 'right')# PRABOWO SUBIANTOdf.senti.4 = as.data.frame(table(senti.prabowo$class))colnames(df.senti.4) = c('Sentiment','Freq')# 数据预处理df.pie.2 = df.senti.4df.pie.2$Prop = df.pie.2$Freq/sum(df.pie.2$Freq)df.pie.2 = df.pie.2 %>%arrange(desc(Sentiment)) %>%mutate(lab.ypos = cumsum(Prop) - 0.5*Prop)# 数据可视化ggplot(df.pie.2,aes(x = 2,y = Prop,fill = Sentiment))+geom_bar(stat = 'identity',col = 'white',alpha = 0.75,show.legend = TRUE)+coord_polar(theta = 'y',start = 0)+geom_text(aes(y = lab.ypos,label = Prop),color = 'white',fontface = 'italic',size = 4)+labs(title = 'Piechart of Sentiments',subtitle = 'Prabowo Subianto',caption = 'Twitter Crawling 28 - 29 May 2019')+xlim(c(0.5,2.5))+theme_void()+scale_fill_brewer(palette = 'Dark2')+theme(legend.title = element_blank(),legend.position = 'right')
文章插图
图5是推特的情绪得分汇总，这些微博被分为负面情绪、中性情绪和积极情绪。消极情绪是指得分低于零的情绪，中性是指分数等于零的情绪，积极情绪得分大于零。从图5可以看出，关键字为“Joko Widodo”的微博的负面情绪百分比低于关键字为“Prabowo Subianto”的tweet 。有6.3%的差异。研究还发现，与关键词为Prabowo Subianto的微博相比，包含关键词“Joko Widodo”的微博具有更高的中性情绪和积极情绪。通过piechart的研究发现，与关键字为“Prabowo Subianto”的tweet相比，带有关键字“Joko Widodo”的tweet倾向于拥有更高比例的积极情绪。但是通过密度图发现，积极和消极情绪得分的分布表明，与“Joko Widodo”相比，包含关键字“Prabowo Subianto”的微博往往具有更高的情绪得分。它必须进行进一步的分析。

R语言进行Twitter数据可视化( 四 )

推荐阅读

决战！平安京|决战平安京，返校季大揭秘，新手最全攻略！！！

十大蓝牙小音箱排行榜，酷狗蘑蘑小音节奏闪灯一键DJ“城会玩”

风筝|《追风筝的人》：每个人终其一生，都在追逐属于自己的命运

电视剧|同样是扮演“乞丐”，孙俪流鼻涕，周星驰抢狗盆，而他本色出演！

赵露思|《骄阳似我》又传出新阵容，李现将搭档赵露思，你认为符合吗？

顶级奢侈品集团Kering的代表品牌及产地和代表作品或风格有哪些

易简财经|27万股民今夜无眠，黄了！两家券商千亿级合并告吹

华为|华为迎来大消息！俄外长刚刚表态，俄罗斯准备与中国以及华为开展5G技术合作

『包不同』疫情之下，京东有惊喜！

#泌尿外科李成方#长期疲劳会影响身体的哪些部分？

亚美尼亚人|二十世纪初，亚美尼亚人遭到了大屠杀，100万人死于土耳其人之手

『雷帝网』CFO称汽车业回报周期长亏损是阶段性的，恒大健康亏近50亿

拜登|美国下任总统已定？拜登犯下“致命”错误，这次奥巴马也“保不住”他！

精子能有杀菌消炎作用吗

怎么样让别人愿意了解自己

时尚旅游守在富豪门前32年，谁能让他动就奖励一万，印度最“尽职”保安

口腔科张兴医生：种植牙要如何护理？牙科医生教你4招，轻松延长使用寿命！很实用

权志龙否认吸毒传闻，曾被指在机场行为异常，疑似毒瘾发作，12年前曾承认吸毒

李云迪和朗朗谁厉害？

高三最后一个学期是啥心态、