加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 分类
    • 学习
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

无废话的机器学习笔记(一)

03/29 11:29
964
阅读需 5 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

  人工智能包括机器学习,机器学习包括深度学习,学好机器学习的基础对入门深度学习有很好的帮助。

机器学习是20世纪50年代就出现的数据分析技术,最近几年才风靡是因为深度学习和增强学习的崛起,如AlphaGo和人脸识别等。前人定义机器学习为一个让计算机自主学习的技术领域,它的核心目的是拟合分类预测,具有极强的融合性,各种交叉学科都可能见到它的身影。

我个人理解就是扔一堆数据给计算机,然后它能分析出数据的规律,进而拟合出规律并预测下一个数据的属性。

应用:语音、人脸识别、语言翻译、计算机视觉、电影推荐、排序等等

分类

监督学习(扔给计算机的数据是带有标签的,就是带有数据的属性,比如带有标签的猫的照片数据,计算机会知道它是猫):

1、回归(regression):利用数据拟合出一个规律,比如(1,1),(2,2)这两点给计算机,它会拟合出y=x这条直线,这也叫线性回归,如果数据变成三维或更高维,则称为多元线性回归

2、分类(classification):计算机主要对数据进行分类,比如猫是猫,狗是狗,这种分类的主流方法有很多,以后会逐一介绍:逻辑回归(名字叫回归但实际是分类哦)、感知机(深度学习的基础)、贝叶斯分类器(为数据分析引入了概率,考试的话送分的)、支持向量机(面试必问,很强大,但实际工业用得少)、决策树(对结果有非常高的解释性,考试的话送分的)、随机森林(很多棵决策树就变成了森林)、K近邻(近朱者赤近墨者黑,考试的话送分的),等等

非监督学习(就是数据没有标签了,计算机不知道谁是谁,只能根据数据的距离或概率分布等作出决策):

1、聚类(clustering):最常用的方法就是聚类,其中最主流、简单的是K均值(与K近邻都是有参数K和距离公式,但两者大大不同),还有高斯混合模型谱聚类等等

强化学习(模型能以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,即可以评价每一次的行为,目标是使模型获得最大的奖赏):

1、马尔可夫决策过程(Markov Decision Process)

学习

要想全面掌握机器学习,我们还要学习很多的学习算法,如著名的梯度下降(BGD、SGD…),牛顿法等,很多基础理论知识,如经验风险最小化方差—误差数据集(训练集、测试集、验证集)、过拟合矩阵分解(奇异值分解SVD)、降维(PCA、LDA…)。

可能很多人像我刚上课一样觉得机器学习就是不断编程嘛,搞代码的一门课,其实不然,如果只是编程,调一个很成熟的sklearn库就能解决大多问题,而且巨方便,但这样和搭积木没有太多区别。深入机器学习就必须了解这些库是怎么通过一行行代码实现的,这样跟调参侠就会拉开差距,所以数学知识很重要,涉及高数、线代、概率论,还有一些凸优化。一起加油吧!

附上其他笔记的链接:

《无废话的机器学习笔记(二)(线性回归)》
《无废话的机器学习笔记(三)(梯度下降)》
《无废话的机器学习笔记(四)(感知机、逻辑回归、贝叶斯)》
《无废话的机器学习笔记(五)(SVM)》
《无废话的机器学习笔记(六)(决策树,KNN)》
《无废话的机器学习笔记(七)(聚类: kmeans、GMM、谱聚类)》
《无废话的机器学习笔记(番外)(数据集,方差-偏差,过拟合,正则化,降维)》

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
TJA1051TK/3,118 1 NXP Semiconductors TJA1051 - High-speed CAN transceiver SON 8-Pin

ECAD模型

下载ECAD模型
$1.64 查看
ABM3B-25.000MHZ-10-1-U-T 1 Abracon Corporation CRYSTAL 25.0000MHZ 10PF SMD

ECAD模型

下载ECAD模型
$1.24 查看
CAT24AA16TDI-GT3 1 onsemi EEPROM Serial 16-Kb I2C, TSOT-23. 5 Lead, 3000-REEL

ECAD模型

下载ECAD模型
$0.78 查看

相关推荐

电子产业图谱