身边有啥常见的但细细研究却很有意思的东西或事情
基于百合网数据的关于黑龙江、北京、上海三地90后年轻人婚恋现状的研究(K组)
听说共青团将帮助大龄未婚青年找合适伴侣 ?现在80后好多大龄青年都找不到对象呢!咱们90后是不是要未雨绸缪一下?那就来看我的研究吧!
一、数据的收集和简单描述1.收集工具:八爪鱼采集器
2.收集过程:
首先打开百合网,页面是这样子的
没有见过世面的我只能注册账号,然后登陆,登陆之后马上推荐来一波妹子...我很懵逼,研究了很长时间,才想到干正事,然后找到了这个搜索功能
由于我想研究的是黑龙江、北京、上海三地90后年轻人婚恋现状,所以我设置年龄为“18-27岁”(即90后),性别分别选择“男”/“女”,地区分别选择“黑龙江省”/“北京市”/“上海市”,其他条件均设置不限,所以共得到六个页面,大采集六次。每一次采集的内容的过程和内容如下:
每次搜索,出来的界面是这样的
——————防辣眼睛线——————
——————防辣眼睛线——————
——————防辣眼睛线——————
——————防辣眼睛线——————
——————防辣眼睛线——————
——————防辣眼睛线——————
——————防辣眼睛线——————
——————防辣眼睛线——————
然后每个妹子头像点进去,这里以一个妹子为例
在这里我们可以获得妹子的一些个人信息以及择偶意向的要求,于是我有目的性地抓取了昵称、年龄、身高、学历、所在地、婚姻状况、月薪、相貌自评、年龄要求、身高要求、学历要求、月薪要求、购房要求这几个量,整理到excel如下:
3.数据的简单描述
我共抓取得到6个Excel文件,分别是黑龙江男、黑龙江女、北京男、北京女、上海南、上海女,分别收集了2637、2193、2534、1967、4370、1561条如上图展示的数据。
4.数据的前期处理
4.1 以下情况的数据删除
空白数据(没填,抓取失败)不符合常理(年龄要求不靠谱)不可见数据(比如:月薪水晶会员以上可见)其他不符合搜索条件的数据4.2 年龄,身高等原来带有单位的定性变量转换为定量变量
4.3 年龄要求、身高要求等包括区间的数据作以下处理:
年龄要求分别求最小值,最大值和平均值;身高要求取最小值,最大值和平均值学历要求取最低学历月薪要求取最小值购房要求取最低要求二、 研究正文——男生篇1.研究背景
2016年中国统计年鉴中说中国目前的性别比为1.05,看似好像不怎么大,但是中国14亿人,如果所有女性都能找到对象的话,那就是3000多万男性必须得单身...工大虽然是高等学府,毕业生找到对象不难,可是在这样一个男女比例7:3的工科院校,缺少人脉,缺乏资源,也没见过几个女生,也不知道怎么与女生交流,再要是其他地方男生趁工大学子好好学习时早已把妙龄女生占为己有,那等工大学子到时候的找对象问题就很大了!由于工大毕业生未来就业在北京上海等大城市的机会比较大,所以对各地区90后女生的基本状况和择偶要求分析是很有意义的,一方面提起单身男性的紧迫感,另一方面知己知彼,未雨绸缪,到时候可以自信坦然地去面对,从而找到适合自己的伴侣。2.研究目标
了解黑龙江,北京,上海三地女生的基本情况,包括年龄、身高、学历、收入的分布,以及自信程度等,了解黑龙江,北京,上海三地女生的择偶要求,包括年龄、身高、学历、收入、房等要求,从而使90后男性能了解目前婚恋市场中女生的基本情况以及女生的择偶要求,有选择地提高自己。3.研究内容
3.1 对年龄的分析
3.1.1 女生的情况
对三地女生年龄进行简单的描述统计,结果如下
看到三地90后女生平均年龄相差不大,都是24岁多点,黑龙江女生的平均年龄相对偏小一点。
在分布图可以看到不管哪个地区,愿意在婚恋市场上找对象的女生数量是随年龄增加而增加的,可见只要过了18岁,女生找对象肯定是越来越着急的。同时也可以发现一个有趣的现象,23岁以前的女生,黑龙江的要比北京上海的多;23岁以后的女生,北京上海的要比黑龙江的多,这其中能说明什么问题,大家可以自己体会(逃。
3.1.2 女生对男生年龄要求的情况
对三地女生对男生的年龄要求(此处年龄取的是最低和最高的平均值)做单因素方差分析可以看到虽然做出来她们对男生身高要求并非一致,但其要求的平均年龄差不多,由于之前提到黑龙江女生的年龄相对较小,所以此处黑龙江女生对男生的年龄要求相对较小没什么问题。但看到北京和上海女生对男生年龄要求相近,于是做了一个他们对男生年龄要求均值相等的假设检验:
P值\u0026gt;0.05故可以得出北京和上海女生对男生年龄要求基本一致。
然后当我画出女生年龄和对应对男生年龄要求的散点图时,我是一脸懵逼的。
数据太多,散成一片,不过还是能看到向上的趋势的,于是我还是做了一下回归分析,得到调整后的R^2为0.311,对于这么一个图来说,可以说很不错了。关系式为:y=7.364+0.809x(x为女生年龄,y为对男生年龄要求)
总之不管怎么样,大多数90后女生总希望找的对象最起码比自己大2、3岁或者更大点,几乎很少的女生在谈恋爱之前愿意找年龄比自己小的男生。
3.2 对身高的分析
3.2.1 女生的情况
对三地女生身高进行简单的描述统计,结果如下
看到三地90后女生平均身高相差不大,都是1.64m多以点,上海女生的平均身高相对偏小一点
在分布图可以看到90后女生身高主要集中在156cm到170cm,其中身高在161cm-165cm的女生最多,对于三个地区来说,女生身高的差异好像不是很大,每个身高区间段的女生比例都差不多。(所以说南方男孩不要以为东北女孩都很高不敢追,到南方找都差不多的!东北那么多好姑娘可别就因为不自信错过了哟!)
3.2.2 女生对男生身高要求的情况
对三地女生对男生的身高要求(此处身高取的是最小身高要求)做单因素方差分析可以看到然做出来她们对男生身高要求并非一致,只能看到对男生身高要求的平均数都在169cm-170cm左右,其他并没有有用的地方。
然后当我画出女生身高和对应对男生身高要求的散点图时,我是二脸懵逼的。
虽然能看出大致向上的趋势,但其实很多女生对最低的身高要求就是自己的身高或者就是160cm,导致了做出来的回归极不明显。R^2=0.01!所以我就放弃用这个图说明问题了。
然后我做了一个操作,就是算出每个年龄值的女生对男生最小身高要求的平均值,然后再做回归,的出来的结果很excited
R^2=0.428,非常满意了!关系式为y=118.296+0.31x(x为女生身高,y为对男生身高要求)我不确定这样的回归方式是不是能很好地说明问题,但我觉得最起码有一定的实际意义,比如我女神身高是164cm,那么她对男生最小身高要求算出来大概是169.1cm,我身高刚好1.7m!哇太棒了,说明我有机会!(最起码这样能给点自信是吧!)
既然直接用的回归没什么用,用平均值做的回归可能原理上不怎么讲得通,那我还是老老实实画些直观点的图吧!下面三个图的横坐标表示女生身高的5个区间,纵轴表示不同男生身高最低要求区间所占的比例!
根据这三个图,大致可以看出女生越高,对男生最低身高要求肯定是越高的,但是有一个反常现象,第一个是身高越高,对男生最低身高要求\u0026lt;161cm的女生居然先减少又增多!而且\u0026lt;161cm和\u0026gt;176cm两个区间共同挤掉了161cm-176cm的空间!还是一样,假如我女神身高是164cm,我身高是170cm,那么女神有大概有50%的几率接受身高\u0026lt;170cm的男生,50%的几率必须要身高\u0026gt;171cm的男生,那么我的机会一半一半,还是敢上的!
那我就要看一下三个地区不同身高的女生对男生最低身高要求一定要在170cm以上的所占的比例是怎么变化的
可以看到女生身高越高,对男生最低身高要求在170cm以上的所占的比例也就越高(当然166cm-171cm的女生出现了反常),也就是说我这种170cm的找对象压力还是挺大的...
可以发现身高在160cm以下的女生中黑龙江女生对男生身高要求在170cm以上的比较多,而160cm以上的女生中上海女生就比较强势,大多有要求男生最低身高在170cm以上。所以小伙儿你找东北姑娘人看你身高不如其他地方姑娘看得多,有喜欢的人挺高的就赶紧追吧!
3.3 对学历的分析
3.3.1 女生的情况
在分布图可以看到不同地区90后女生学历相差不大,可能黑龙江女生大专以下的学历多一点,本科以上的少一点,但总体相差不大。所有地区90后女生学历都集中在大专和本科,所以小伙你要是在读高中,你真的该好好学习,你看要是你直接高中毕业,比不上大多数女生,当然我工大学子在这方面肯定是没什么问题了!但是我们也需要知道现在女生学历都很高哦!
3.4.2 女生对男生学历要求的情况
下面三个图的横坐标表示女生的5个学历,纵轴表示不同的男生学历最低要求所占的比例!
推荐阅读
- 。。
- 大家身边有那种特别“轴”的人么这样的人给你啥感觉
- 有啥看上去很普通但了解之后发现很厉害的东西
- 有啥吃的东西是咸的而没有油
- 为啥在看了比身边人多许多的书与感悟之后 还是不会说话?
- 生活中的常见病及处理方式
- 因为考研,身边的朋友、同学几乎全部都断了联系,为啥呢是他们绝情还是我跟他们的路不同呢
- 你们身边有洞察力特别敏锐的人吗洞察力强是啥感受
- 共轭亚油酸CLA减肥好用么有啥相关或者类似推荐么
- cardamom(小豆蔻)和nutmeg(豆蔻)有啥区别和联系