阿里为啥不让我过笔试
我给的答案:产品名称:商品评价指数
产品界面:
产品页面:
搜索页面:
比较页面:
产品数据逻辑:
需求分析:
淘宝/天猫的用户购买产品时的成本很大(用户的注意力),是因为产品的数量太多,更加具体一点就是当用户搜索了某一款产品时面临的选择也是成百上千的。另外,用户进入一个产品页面,一般会去看产品评论(有研究指出,超过70%的用户在线上购买商品时会去读产品评论)而产品评价的数量也是少则几百,多则上万的。这种大量的评论数据带来的信息过载问题,使得用户不可能有精力去看每一个产品的每一条产品评论。基于这样一种考虑,我希望推动一款基于商品评价的数据产品。将大量的非结构化的产品评价转化为结构化的对应于商品属性的数
据。并可视化给用户。
对厂家和行业可能的用处。传统的公司、生产商想到获得用户反馈,一般采用调查问卷,邮件/电话回访的方式。这些方式要么容易引起消费者的反感,要么成本较高。而在线商品评论属于UGC内容,区别于其它方式,如果我们能用有效的文本挖掘方式,将在线评论的评价对象和情感倾向进行挖掘,那么对于厂家而言也能有效的获得市场反馈。例如,在线评论反映出来的,对于所有安卓的智能手机,内存小于2g时,情感普遍倾向为负,而当内存达到2g及以上后,用户评价情感为正。这个时候,场家有效的知道市场上对于内存的需求应该位于2g,既不用花费成本在增加内存上,而且能够迅速了解市场反应。
对阿里或者淘宝/天猫。作为生态系统的监督者和规则的制定者,淘宝或者天猫需要对平台内流通的商品进行监督。联想到今年年初的工商总局对淘宝和天猫等电子商务平台假货横行的质疑,天猫、淘宝需要对平台上的商品进行审核。而一般假货会从真货的官网/店铺等复制产品介绍和图片视频等。如果依赖线上平台打击假货,个人认为基于用户评价也许会成为一个方向。毕竟依赖线下的授权监督等,不如线上处理的速度快。
大数据在其中的地位和价值:
第一,评论文本在电子商务平台中本身就是大数据。即,数据量大,文本维度大等。
第二,产品的结果依赖于有效的大数据算法(自然语言处理,文本挖掘,情感分析)。
现在有的产品和问题:
现有产品:基于商品评价的产品,各个电子商务平台都推出了类似于“买家印象”的产品,这样一款比较有效的提取了产品的评论信息。不过有两个未解决的问题,一是定量的问题,即能对应到整体评论有多少属于某个属性,正负情感的概率为多少。另一方面,未解决属性归类的问题。例如:“价格便宜”和“性价比高”所反映的都是指价格属性,情感倾向为正。只有完成了属性归类和定量计算,才能实现需求中所说的困难。
技术问题:自然语言处理和文本挖掘在评论数据上的应用。产品评价的特征抽取和情感分析算法。利用lda,word2vec等较好的解决属性归类的问题。情感分析,借鉴产品情感词典和用户打分对特征的情感词进行提取。
冷启动问题:有的产品评论数量很少。产品评论数量少会使得特征和情感推断有偏,所以产品评论数量小于某一阈值的时候,不计入产品范围。
产品目标和考核标准:
推荐阅读
- 为啥看到书柜上的藏书会有心旷神怡的感觉
- 为啥知乎上普便有一种【我在北上广深打工,所以拥有更好的视野】这样的错觉
- 为啥工商银行的用户体验如此之差
- 汽车|看了中消协4S店服务测评调查结果,终于知道法系车为啥卖不好了
- 你为啥从窝窝商城离职?
- 为啥5G和2.4G默认的BSSID是相同的
- 为啥电器实体店的价格比淘宝贵那么多
- 现在在线学习视频有很多了,为啥大部分人还是喜欢下载下来观看
- 为啥到现在你还没有女朋友 ?
- 天赐的声音|33岁张雨绮为啥总离婚?看过这些照片就明白了,都是性感惹得祸