谷歌(Google)面试学习手册,最基础的就是数据集了manbetx客户端

1.当众的数据集

灵感来源
谷歌(谷歌)面试学习手册

做多少解析和数码挖掘,最基础的就是数据集了,那里享用部分科研机构、集团、政党会盛开的部分数量集。那几个数据集经常相比完善、质地相对较高。给我们推荐一些常用的可以获得数据集的网站:

UCI:加州大学欧文分校开放的经典数据集,真的很经典,被很多机器学习实验室选用。

这是?

那是自我为期数月的就学安插。我正要从一名活动端软件开发者(自学,无计科文凭)转型成为一名机器学习工程师。

本身的紧要性对象是找到一种以推行为主的求学形式,并为初专家抽象掉超过半数的数学概念。
这种上学格局是非传统的,因为它是专程为软件工程师所安插的自上而下、以结果为导向的学习方式。

假若你想让它更好的话,随时欢迎您的孝敬。


Awesome Public
Datasets
:那是github一大神整理的一个加上的数额集资源获取渠道合集。

目录


江山数据:数据来源于中国国家统计局,包罗了我国经济民生等多少个方面的数码。

干什么要用到它?

我会为了自庚子来的工作————机器学习工程师
坚守那份安顿。自二〇一一年来说,我一贯进展着移动端应用的付出(包括安卓、iOS与一加)。我有软件工程的文凭,但没有电脑科学的文凭。我只是在高校的时候学习过一些基础科学,包含微积分、线性代数、离散数学、概率论与总计。
自我认真想想过我在机械学习地方的兴趣:

本身陷入困境。

据我所知,
机械学习有三个样子

  • 实用机器学习:
    这些样子重若是查询数据库、数据清洗、写脚本来转化数据,把算法和库结合起来再添加部分定制化的代码,从数量中挤出一些精确的答案来验证一些辛劳且模糊不清的问题。实际上它可怜混乱。
  • 力排众议机器学习:
    那个样子紧假若有关数学、抽象、理想情况、极限条件、典型事例以及一切恐怕的特色。这几个势头格外的干净、整洁,远离混乱的现实性。

自家认为对于以举行为主的人的话,做好的主意就是
“练习–学习–练习”,那代表每个学员一早先就能出席部分共处项目与一些问题,并磨炼(解决)它们以熟悉传统的法子是肿么办的。在有了有些概括的勤学苦练经验之后,他们就足以初始钻进书里去学习理论知识。这一个理论知识将接济她们在将来拓展更进一步的教练,充实他们排忧解难实际问题的工具箱。学习理论知识还会强化他们对那多少个不难磨炼的精晓,协助他们更快地获取进阶的阅历。

那是一个很长的陈设,它花去了自我一年的日子。假使你早已对它具备精通了,它将会让您节省很多年华。

CEIC:当先128个国家的经济数据,可以规范查找GDP,
CPI, 进口,出口,外资一贯投资,零售,销售,以及国际利率等深度数据。

哪些使用它?

以下的内容总体是大约,你要求从上往下来缓解那么些品种。

我利用的是Github独特的flavored markdown的职分列表来检查自身布署的展开。

  • [x]
    创造一个新的道岔,然后您可以这么来标注你早已形成的品类,只需要在框中填写一个x即可:[x]

摸底越多关于 Github-flavored
markdown的学识

中华总括音讯网:国家计算局的官方网站,会聚了海量的全国各级政党各年度的国民经济和社会前行总计音讯。

Follow me

本身是一名可怜可怜想去美利哥办事的越南社会主义共和国软件工程师。

自己在这份陈设中花多少日子?在天天的辛勤卓越工作到位后,每晚花4刻钟。

自我早已在落到实处梦想的旅途中了。

Nam Vu – Top-down learning path: machine learning for software engineers
USA as heck

多少个政务数据开放做的相比好的地域:巴黎市政务数据服务网  香港(Hong Kong)市政务数据资源网 
 
汕头市政党数量统一开放平台 
 云南省政党数码开放平台**

别认为自己不够聪明

当自家打开书本,发现他们告诉自己多元微积分、总括与推理、线性代数是学习机器学习的先决条件的时候,我十分心寒。因为自身不明白从哪里先河…

其余可以参考:有哪些一般人不晓得的数目得到格局

有关视频资源

部分视频唯有在Coursera、EdX的科目注册了才能来看。尽管它们是免费的,但多少时日段那个科目并不开放,你恐怕须求等上一段时间(可能是少数个月)。我将会拉长愈多的公然的视频源来代替那几个在线课程的摄像。我很快乐大学的讲座。

2.博客资源

准备知识

那些小章节是有的在天天安排开首前我想去通晓的有的预备知识与局地有趣的音讯。

CSDN大数据:各样干货博客每天更新,平时会有悲喜。

天天安插

各类大旨都不须要用一整天来完全精通它们,你能够天天形成它们中的多少个。

天天我都会从上边的列表中选一个出来,四回又一回的读,做速记,磨练,用Python或R语言达成它。

开源中国大数量:数据方向各类干货博客。

动机

爱可可-爱生活:数据挖掘领域出名微博,优质机器学习资源分享,由北邮的教员创造。

机械学习概论

刘未鹏 | Mind
Hacks
:刘未鹏的博客,就算更新很慢,但作品都很深切。

支配机器学习

自我爱机器学习:超多机器学习干货,质地都不行高。

诙谐的机械学习

3.乐乎专刊

机械学习简介(用指尖沾上墨水来书写机器学习简介)

一个数量分析师的自己修养分享数据解析经验和意见为主,时不时扯点关于游戏的事。

一本深切的机器学习指南

多少冰山各个事情数据解析,常常聊到小车。

故事与经历

数据解析侠注意数据解析,很多技能干货。

机器学习算法

董先生在硅谷董先生的专栏,分享技术与职业发展

入门书籍

智能单元有关人工智能和深度学习,还有cs231n的笔记。

实用书籍

无痛的机械学习介绍机器学习的算法原理与利用。

Kaggle知识竞技

混沌巡洋舰饱含数据正确的居多世界知识。

雨后春笋录像

4.免费读书网站

MOOC

菜鸟教程:种种编程语言、数据库等学习资源,知识梳理卓殊显明。

资源

DataCamp:Python、R、数据解析、数据挖掘学习。

化为一名开源进献者

edx-数据科学:edx的具有数据科学方向的学科。

游戏

Data Science Courses |
Coursera
:Coursera上拥有的数量正确课程。

播客

全套课程 |
MOOC大学
:MOOC高校所有数据正确课程。

社区

硬创公开课:雷锋网推出的人工智能方向的公开课。

有关会议

5.行业网站

面试题目

Analytics
Vidhya
:超多实用的多寡解析、数据挖掘干货作品,也含有行业资讯。

自己敬佩的信用社

36大数据:大数目方向行业资讯,也有一部分干货的稿子。

数据分析网:大数量行业资讯。

数码科学:大数据资讯、观点、数据解析技术研习中央。

雷锋网:雷锋网此前做科学技术媒体,现在转型数据科学和人造智能方向,做的也无可非议。

199IT大数目导航:相比较全的大数据有关网站导航,应有尽有。

数码解析网导航:数据解析网推出的大数据方向网站的领航。

6.数目科学比赛

DataCastle:国内标准的多寡挖掘比赛平台,由周涛助教发起。

Kaggle:国外覆盖人数最多的数目正确竞技平台。

天池:阿里旗下多少比赛平台。

7.学术随想

Best paper
awards
:包罗AAAI
KDD IJCAI
CVPR等十多少个甲级会议从1996年的话的保有一级随想,做多少科学商讨的世界级资源。

arXiv.org:强大的杂谈库,可以搜索你要求的德众随想资源。

SIGKDD:数据挖掘领域的超级会议,KDD每年的散文和KDD
CUP都有为数不少可学习的东西。

Google学术:站在巨人的肩上,不解释。

谢谢我们,不嫌麻烦能够协助一下呗!此回应持续立异……