【推荐】大数据和人工智能:30个很棒且免费的公共数据源

海促会2018-12-11 14:11:54

点击上方蓝色字体,关注我们

15



机器学习、人工智能、区块链、预测分析——所有令人惊叹的技术都承诺将革新商业和社会。 



但如果没有数据的话,这些技术就一无是处。所幸的是,对于那些没有资源有条不紊收集每一条有用信息的企业和组织而言,他们可以免费从网上得到庞大(并且不断增加)的数据。

 

我们列出了2018年的30个免费在线大数据来源:

 

1、世界银行开放数据(WorldBankOpenData),是涵盖了全球人口统计数据、大量经济和发展指标的数据集。

 

2、国际货币基金组织数据(IMFData),国际货币基金组织公布的国际财务状况、债务率、外汇储备、商品价格和投资数据。

 

3、美国国家教育统计中心(TheUSNationalCenterforEducationStatisticsData),提供了覆盖美国和世界各地的教育机构和教育人口统计的数据。

 

4、英国数据中心(TheUKDataCentre)是英国最大的社会、经济和人口的数据集。

 

5、FiveThirtyEight,有大量提供政治和体育问题舆论数据的民意调查。

 

6、FBI统一犯罪报告(FBIUniformCrimeReporting),联邦调查局负责编辑和出版国家犯罪统计数据,并在国家、州和县级提供免费数据。

 

7、美国司法局(BureauofJustice),在这里你可以找到关于美国执法机构、监狱、假释和缓刑机构及法院的数据。

 

8、QlickDataMarket提供免费包,可访问涵盖世界人口、货币、发展指标和天气数据的数据集。

 

9、美国宇航局外行星存档(NASAExoplanetArchive)的公共数据集涵盖了由美国宇航局空间探索任务收集的行星和恒星数据。

 

10、联合国贸易数据库(UNComtradeDatabaseStatistics)统计是由联合国汇编并出版的资料,包括ComtradeLab,展示了如何使用尖端分析和工具从数据中提取价值。

 

11、金融时报市场数据(FinancialTimesMarketData)是关于全球金融市场的最新信息,包括股票价格指数、商品和外汇。

 

12、谷歌趋势(GoogleTrends)是检查和分析全球互联网上搜索活动和趋势新闻的数据。

 

13、Twitter,Twitter的优势在于大多数对话都是公开的,这意味着大量的数据可以通过其API获得,谁正在谈论什么,何地、何时以及为什么。

 

14、谷歌学术(GoogleScholar)包括学术论文、期刊、书籍和法律判例法的文本内容。

 

15、Instagram,与Twitter一样,Instagram的帖子和对话默认为公开,其API允许对喜欢、提及和商业细节进行分析。

 

16、OpenCorporates是全球最大的企业开放数据库。

 

17、GlassdoorAPI提供了有关职位空缺、候选人、薪水和员工满意度的信息,可通过他们的开发者API获得。

 

18、IMDBDatasets,是从网络上最大的电影、电视和从业人员中获得的多种格式数据集。

 

19、OpenLibraryDataDumps是关于世界各地图书馆书籍目录的数据集。

 

20、LabelledFacesintheWild整理并标记了13,000个人脸图像,用于开发涉及面部识别的应用。

 

21、MicrosoftMarco是微软的开放式机器学习数据集,用于阅读理解和问题回答的培训系统。

 

22、机器学习数据集知识库(MachineLearningDatasetRepository)由集合了由参与机器学习项目的数据科学家贡献的开放数据集。

 

23、易趣市场数据洞察(eBayMarketDataInsights)提供了来自eBay的数以百万计的在线销售和拍卖数据。

 

24、自然历史博物馆数据门户(NaturalHistoryMuseumDataPortal)提供了关于伦敦博物馆藏品中近400万个历史标本的信息,以及自然世界的科学录音。

 

25、欧洲核子研究中心开放数据(CERNOpenData),欧洲核子研究中心开展的粒子物理实验提供了超过1PB的数据。

 

26、OneMillionAudioCoverImages数据集托管在archive.org上,涵盖世界各地发布的音乐,用于图像处理研究

 

27、CompletePublicRedditCommentsCorpus,2007年至2015年期间在Reddit上发布的10多亿份公共评论,用于训练语言算法。

 

28、MicrosoftAzureDataMarketsFreeDatasets,提供了涵盖从农业到天气所有内容的免费数据集。

 

29、IrishElectricVehicleChargePointStatus收集了这个负责爱尔兰共和国和北爱尔兰电动汽车充电站网络数据机构的数据。

 

30、LondonAir提供了来自伦敦各地的污染和空气质量数据。


 


免责声明:

本文由“ 大数据周刊”授权转发,来源于“Forbes”,图片来自互联网,内容为原作者个人观点,并不代表本公众号赞同其观点和对其真实性负责。如涉及作品版权问题,请与我们联系,我们将在第一时间删除内容!


更多文章推荐







【推荐】未来2-3年或迎数据时代的真正高潮!

【推荐】区块链红利最新好消息!

【推荐】工信部:做好互联网、大数据、人工智能与实体经济深度融合的政策制定工作!

【推荐】微信大数据解析不一样的人生,你被戳中了吗……

【推荐】BTV 发布《2018年度315维权大数据报告》

【推荐】大数据等最核心的关键技术:32个算法

【推荐】两会大数据:看各年龄段人群都关注哪些热点议题?

【推荐】2018年最值得关注的15大技术趋势

【推荐】避免这7个数据错误,让你的数据分析更有效率!

【推荐】《中国区块链行业发展报告2018》全文发布!

【推荐】“揭秘”大数据的10个神话!

【推荐】中原:人工智能在未来是怎样改变大都市生活的?

【推荐】10年内,这三大领域将被人工智能和大数据重塑!

【推荐】全景动态图解高铁格局,数据洞悉大国之城谁将崛起!

【推荐】麦肯锡发布176页中国数字经济报告:数字中国引领全球


 


Copyright © 古田计算器虚拟社区@2017