推荐收藏 | 200+各行业「源数据」网址帮你整理好了!
文章图片
文末领取【Python核心知识高清导图】
王术|作者
知乎|来源
部分内容来自网络
导读:资料搜集是个相当繁琐与累的工作 , 也是数据分析入门的基本 , 良好的信息资料搜集能力有利于我们快速了解基本情况 , 为后续的调研及一手资料的获得打下较好的基础 。
1
搜索引擎
搜索引擎是我们信息资料搜集的最重要的渠道之一 , 用搜索引擎查找信息资料需要使用恰当的关键词和一些搜索技巧 。 目前国内主要的搜集引擎有如下10个 , 近期还有较多行业型搜索冒出来 , 需找专业型行业资料可以使用行业型搜索引擎 。
由于每个搜索引擎都有一定的局限性 , 可以把要搜索的关键词在多个搜索引擎试一下 , 可能会搜出你意想不到的结果 。
大家对国内的引擎基本都很熟悉 , 尤其是百度和google , 需要搜索同一主题的资料 , 不同的人所搜出来的结果可能就天差地别了 , 主要原因在于如下两点:
文章图片
1.搜索关键字的选择
举例说明 , 假如我们要搜索大数据行业发展相关资料 , 如果我们就在百度上搜索“大数据” , 结果非常多 , 无法进行筛选 , 可以对关键词进一步界定 , 如“大数据行业”“大数据市场规模”“中国大数据产业”“大数据技术”“大数据企业”等等 , 需要不停地变换搜索关键词 , 直到查到满意的搜索结果 。
在查找的过程中可以根据查找结果内容再进行对关键词进行修正 , 修正有些名称专业表达方式 , 因为最开始搜索我们表达的不一定准确 。
2.搜索技巧
主要是针对百度、google等搜索引擎一些高级搜索技巧 。 常用技巧主要有如下几个方面:
文件类型搜索
使用filetype , 如在百度或google中键入“filetype:pdf大数据”搜索出有关大数据内容pdf内容 , 而且这些文档基本都是可直接下载 。 还可以变换为其他的 , 如“filetype:doc”“filetype:ppt”“filetype:xls”等等 。 注意其中的冒号为英文的冒号 , 一定要变换为英文冒号 。
定位于哪个网站上搜索
使用site , 如在百度或google中键入“大数据空格site:sina.com”,则在sina.com搜索有关大数据的一些资料信息 , 这个特别适用针对某些信息可能在哪些网站上出现的一个快速搜索方法 。 注意冒号也是英文的 , 网站名称也不用加www 。
精确匹配搜索
使用“” , 如在百度中键入“大数据行业” , 表示搜索“大数据行业”五个必须联在一起的 , 如果不加“” , 搜到的为大数据及行业两个词并列显示结果 , 没有这么精确匹配 。
限制性的网页搜索
使用intitle,如在百度键入“intitie:大数据” , 限定于搜索标题中含有“大数据”网页 , 如果输入“intitie:大数据市场规模”限定于搜索标题中含有“大数据”和“市场规模”的网页 。
Google学术搜索滤掉了普通搜索结果中大量的垃圾信息 , 排列出文章的不同版本以及被其它文章的引用次数 。 略显不足的是 , 它搜索出来的结果没有按照权威度(譬如影响因子、引用次数)依次排列 , 在中国搜索出来的 , 前几页可能大部分为中文的一些期刊的文章 。
Scirus是目前互联网上最全面、综合性最强的科技文献搜索引擎之一 , 由Elsevier科学出版社开发 , 用于搜索期刊和专利 , 效果很不错!
Scirus覆盖的学科范围包括:农业与生物学 , 天文学 , 生物科学 , 化学与化工 , 计算机科学 , 地球与行星科学 , 经济、金融与管理科学 , 工程、能源与技术 , 环境科学 , 语言学 , 法学 , 生命科学 , 材料科学 , 数学 , 医学 , 神经系统科学 , 药理学 , 物理学 , 心理学 , 社会与行为科学 , 社会学等 。
BASE是德国比勒费尔德(Bielefeld)大学图书馆开发的一个多学科的学术搜索引擎 , 提供对全球异构学术资源的集成检索服务 。 它整合了德国比勒费尔德大学图书馆的图书馆目录和大约160个开放资源(超过200万个文档)的数据 。
Vascoda是一个交叉学科门户网站的原型 , 它注重特定主题的聚合 , 集成了图书馆的收藏、文献数据库和附加的学术内容 。
与google比较了一下发现 , 能搜索到一些google搜索不到的好东东 。 它界面简洁 , 功能强大 , 速度快 , YAHOO、网易都采用了它的搜索技术 。 各位可以一试 。
Google在同一水平的搜索引擎 。 是Amazon.com推出的 , Webresult部分是基于Google的 , 所以保证和Google在同一水平 , 另外增加了Amazon的在书本内搜索的功能和个性化功能:主要是可以记录你的搜索历史 。
一个检索免费paper的好工具 。 进入网页以后 , 可以看到他有三个功能 , driectorywebarticle , 其中article对我们很有帮助 , 你可以尝试输入你要找的文章 , 会有很多发现的!
在此搜索引擎里可以搜索到超过千万种化学品信息或相应的供应商 , 与Chemblink有点相似 , 但提供的化学品理化信息没有Chemblink详细 , 与其不同的是该搜索引擎可提供化学品结构式搜索(主页上有在线绘制化学结构式的搜索框) 。
2
【推荐收藏 | 200+各行业「源数据」网址帮你整理好了!】数据库
数据库是研究人员重要的数据来源之一 , 目前券商、基金研究研究机构都购买有商业数据库 , 目前研究用的数据库主要分为两大类 , 一是商业数据库 , 二是学术数据库 。
文章图片
1.商业数据库
商业数据库大多为金融投资所用 , 主要分为国内与国外数据库两大类 。
国内商业数据库
国内数据库主要有如万德、恒生聚源、锐思数据库、CSMAR数据库、巨潮数据库等 。
目前万德数据库主要定位于国内高端客户 , 市场占有率较高 , 80%左右 , 当然其售价较高
恒生聚源也定位为机构客户 , 性价比较高 , 售价要比万德便宜的多
CSMAR数据库定位于学术与高校 , 其中金融数据比较全 , 强大
锐思数据库定位于学术 , 质量一般
巨潮数据库为深交所旗下数据库 , 有一定的特殊优势
国外商业数据库
国外数据库主要有彭博、路透社、CEIC、OECD、HaverDatabase、ThomsonFinancialOneBanker等 。
国外数据库中彭博是比较全也大的 , 在国内销售也较好 , 但是售价奇贵 。 一般不做国际市场研究 , 大多用不到国外数据库 , 毕竟国外数据库公司对国内的行业数据及公司数据不如本土数据库公司的做得好 。
2.学术数据库
学术数据库基本为高校、研究机构所用 , 也分为国内与国外两大类 , 学术数据库中一些学术论文、行业数据、统计年鉴还是有用的 , 缺点就是其中有些数据的相对较旧 , 无法做到实时更新 。
国内学术数据库
中国知网:国内最大学术数据库 , 包括期刊、学位论文、统计年鉴等
万方数据:仅次于中国知网 , 包括期刊、学位论文等
人大复印资料:期刊、论文等
维普:期刊、论文等
中经网:有较多行业研究报告 , 宏观数据较全
国研网:数据较为权威 , 有些报告可以一看
上海公共研发平台:可以注册 , 人工审核 , 内包含较多数据库
国外学术数据库
EBSCO:较全的一个数据库 , 内包含较多的商业数据 , 好用
Elsevier:学术文章全 , 更新速度快
以上大致介绍了国内的商业及学术数据库 , 但这些数据库都是通过收费或学校账号才能使用 , 对于平时临时研究用的一些人 , 没有必要去购买 , 下面介绍一些免费可用的数据库 。
数据汇:国内的宏观数据 , 国外的也有一部分 , 可以导出来 , 免费好用 。
3
共享文库
首先也非常感谢共享文库的出现 , 使得大家搜集信息方便了许多 , 随最早的豆丁、百度、爱问等共享文库的出现 , 随后到如今出现许多共享文库 , 不过很多文库规模较小 , 文档数量较少 。
文章图片
1.国内主要文库
百度文库
国内文档数据量最大的共享文库 , 综合型的 , 好用 。
豆丁文库
其收费的盈利模式导致用户数量逐年减少 , 文档质量也不如百度文库 。
爱问共享
综合型文库 , 里面也时常发现好的行业研究报告 , 电子书籍等 。
道客巴巴
综合型文库 , 后起之秀 , 文档数量和质量较好 。
新浪地产
国内最大房地产类文库 , 房地产相关策划、数据较全 。
2.国外文库
针对以上国内的共享文库 , 都可以通过注册账号 , 上传分享资料赚取积分 , 通过积分可以下载文库资料 。
如果有些文档看过后不错想保存下来积分不够 , 可以通过文库下载器来免费下载保存 , 文库下载器有如“冰点文库下载、易读下载、老张文库下载”等等 , 如果只看重其中一部分内容 , 可以通过QQ拷屏方式保留下来(登陆QQ , ctrl+alt+a拷屏) 。
4
专业网站
在共享文库未出现以前 , 专业论坛一直担任着查找资料的好去处 , 的确国内的一些论坛经过这么多年的运营 , 已经积累大量有用文档 。 下面主要介绍我们常用的专业论坛 。
文章图片
1.人大经济论坛
经济、学术型论坛 , 其中行业研究、统计年鉴数量多 , 更新速度快 , 我的最爱 , 常用 。
2.经济学家
经济学专业论坛 , 其中统计年鉴、行业报告、国内外数据等有特色 。
3.随意网-经济论坛
新建网站 , 有些内容尚可 。
4.理想在线
股票券商研究报告 。
5.迈博汇金
股票券商研究报告 , 目前已经收费了 , 只能查询有哪些最新报告了 , 无法下载 。
6.博瑞金融
http://www.brjr.com.cn/forum.php;
金融行业专业型论坛 。
7.华尔街社区
国内专业的金融论坛 。
8.投行先锋论坛
专业型为投行人士探讨而设立的论坛 。
9.春晖投行在线
证券相关政策的汇编整合论坛 。
pe投资专业型论坛 。
11.其他专业网站
5
政府部门
政府部门是国内公开数据的来源 , 查询权威的数据可以到政府相关部门网站 , 以下介绍国内的主要发布相关数据的政府部门 。
文章图片
1.国家统计局
这个不用多说 , 大家很多人浏览过 。
2.工业和信息化部
较多数据在此发布 , 尤其是有关工业运行及信息化相关数据 。
3.中国人民银行
中国金融市场政策及运行相关数据 。
4.银监会
银行金融相关数据 。
5.中国海关
中国进出口相关数据 。
专利相关查询 。
相关政策及招股书披露平台 , 以及拟上市公司排队每周披露 。
6
证交易所券
文章图片
1.上海证券交易所
其中研究出版栏目中有些研究报告 。
2.深圳证券交易所
其中研究/刊物中有研究报告 。
新三板挂牌公司的转让及信息披露 。
4.香港证券交易所
7
如何寻找国外数据
1.搜集美国相关数据
由位于华盛顿的美国政府印刷办公室出版、经济顾问委员会撰写的《总统经济报告》(EconomicReportofPresident) , 提供了有关美国当前经济形势的描述和主要宏观经济变量数据 。 相当多的数据都可以追溯到1959年 , 甚至个别的可追溯到1929年 。
可能你已经留意到了 , 好多有关美国的图形 , 都是采用《总统经济报告》(2005)所附数据生成的 。 这些数据可以免费下载 , 网址:http://www.access.gpo.gov/eop/
如果想获得最近数据的详细资料 , 一个不错的选择是 , 美国商务经济分析局每月出版的《当代商业纵览》(SurveyofCurrentBusiness) 。 网址:http://www.bea.doc.gov/
文章图片
2.如何搜集国外其他经济体数据
对富裕国家来说 , 最有用的资料来源于经济合作与发展组织(OrganizationofEconomicCooperationandDevelopment , 简称OECD) 。
经济合作与发展组织的成员包括:奥地利、澳大利亚、比利时、加拿大、捷克共和国、丹麦、芬兰、法国、德国、希腊、匈牙利、冰岛、意大利、日本、卢森堡、墨西哥、荷兰、新西兰、挪威、波兰、葡萄牙、韩国、西班牙、瑞典、瑞士、土耳其、英国和美国 。
看来 , 世界上的富裕国家大都属于该组织 , 其产出占世界产出的70%左右 。
OECD的网址:http://www.oecd.org/
提供三种极为有用的数据:
《OECD经济展望》(OECDEconomicOutlook) , 每年出版两次 , 提供许多跨国宏观经济数据 。 这些数据一般都上溯到20世纪70年代 , 而且具有很好的一致性 。
《OECD就业展望》(OECDEmploymentOutlook) , 每年出版一次 , 专门提供劳动力市场的数据 。
《OECD历史统计》(OECDHistoricalStatistics) , 不定期出版 , 将当期数据和过去数据放在一起 。
对于不是OECD成员的国家和地区 , 可以从其它国际组织那里获得相关数据 , 比如国际货币基金组织(InternationalMonetaryFund , 简称IMF) , 网址:https://www.imf.org/
IMF提供《国际金融统计年鉴》(InternationalFinancialStatisticsYearbook) , 它主要提供成员国的金融数据 , 但也包括一些总体数据 , 比如GDP、失业和通货膨胀等 。
至于若干国家长期的统计数据 , 两个不可多得的数据来源是 , Heston-Summers数据库和Madison数据库 。
Heston-Summers数据库提供168经济体在1950-2000年间的跨国可比数据 , 在宾夕法尼亚大学国际比较中心(CenterforInternationalComparisonsattheUniversityofPennsylvania)网站上可以下载:http://pwt.econ.upenn.edu/
Madison数据库提供了自1820年以来56个经济体的数据 。
最后 , 如果还没有找到你要的数据 , 不妨登陆下面的两个网站 , 也许是根稻草 。 哈佛商学院的宏观经济学资源网站提供了大量连接:https://www.hbs.edu/faculty/units/bgie/Pages/default.aspx
8
分行业网站
文章图片
1.互联网及传媒
资讯类
新浪科技
腾讯科技
艾瑞网
虎嗅网
钛媒体
游戏大观
亿欧网
媒介36
数据类
中国票房
中国互联网络信息中心
艾瑞网
易观智库
游戏产业网
百度指数
大数据导航
CSM(电视收视率)
微排片
2.银行业
新闻资讯
中证网
财新网
中国金融新闻网
公告、数据查找
中国货币网
银监会
深圳证券交易所
3.有色金属
日报网站
宏观新闻:央行快讯
公司公告:巨潮
文章图片
9
其他
除以上介绍的几种资料搜集渠道外 , 我们也结合近年it科技的发展 , 在博客、微博、空间等去搜索 。
1.行业协会网站
每个行业协会基本都会有网站 , 在该网站上能够查找一些对本行业的描述、相关数据等 。
2.博客
国内有网易、新浪、搜狐、百度空间、和讯等博客网站 , 有些数据也可以从搜索博客中找到 。
3.微博
新浪微博及腾讯微博 , 用数量极大 , 其中有些数据可以通过搜索查询到 。
4.微信
微信用户已经超过4亿 , 每个人都是新闻的发布者 , 其中数据资源丰富 , 但目前还未提供全文搜索功能 , 只能通过关注相关公共账号或关注朋友圈获取 。
5.QQ空间
有些企业或机构QQ空间会有些报告及数据发布 。
6.全景网
推荐阅读
- 剑与远征秘宝峡湾第二关怎么过?剑与远征秘宝峡湾第二关阵容推荐攻略心得
- 推荐|沈阳一门市发生爆炸,系正在营业的包子铺,有消防队员受伤
- 推荐|北京丰台一处自来水井发生“井喷”,多方联动,不到一小时修好
- 补水眼霜哪个牌子好用 十大口碑好的补水保湿眼霜推荐
- 湖北武汉|武汉高校教师战“疫”钢笔画获中国国家博物馆收藏
- 全球保湿水品牌排行榜 口碑最好的保湿水推荐
- 推荐|疫情报告:31省区市新增22例均为境外输入,北京连续11天零新增
- 推荐|突发!特朗普所乘“空军一号”险撞无人机,无人机样式曝光
- 思萌娱乐|老人收藏慈禧唯一真实照片,专家问多少钱才捐,老人如何回答的
- 峡湾|剑与远征秘宝峡湾第四关怎么过?剑与远征秘宝峡湾第四关阵容推荐及攻略详解