想搞机器学习?先把这些数学符号“征服”吧

2018-04-10 16:57:29 来源:机器之心
标签:

 

本文介绍了机器学习中的基本数学符号。具体来说有算数符号,包括各种乘法、指数、平方根以及对数;数列和集合符号,包括索引、累加以及集合关系。此外,本文还给出了 5 个当你在理解数学符号遇到困难时可以应急的小技巧。

 

在机器学习中,你永远都绕不过数学符号。

 

通常,只要有一个代数项或一个方程符号看不懂,你就完全看不懂整个过程是怎么回事了。这种境况非常令人沮丧,尤其是对于那些正在成长中的机器学习初学者来说更是如此。

 

如果你能了解一些基本的数学符号以及相关的小技巧,那你就在看懂机器学习方法的论文或书籍描述上前进了一大步。

 

在本教程中,你将学到机器学习技术描述中遇到的基本数学符号。

 

在学完整个教程后,你会知道:

算术符号,包括若干种乘法、指数、平方根以及对数

数列和集合符号,包括索引、求和以及集合关系

5 种当你看不明白数学符号的时候可以采用的应急方法

 

让我们开始学习吧!

 

 

机器学习中的基本数学符号

教程概览

本教程分为 7 个部分,分别是:

1. 看不懂数学符号的沮丧

2. 算术符号

3. 希腊字母

4. 数列符号

5. 集合符号

6. 其他符号

7. 更多帮助资源

 

看不懂数学符号的沮丧

你在阅读机器学习算法的相关内容时会遇到一些数学符号。举例来说,这些符号可能会被用来:

描述一个算法

描述数据的预处理

描述结果

描述测试工具

描述含义

 

你可能在论文、教科书、博文以及其他地方看到这些描述。相关代数项常常会给出完整定义,但你还是会看到不少陌生的数学符号。我曾多次深受其苦,简直太令人感到挫败了!

 

在本教程中,你会复习到一些帮助你看懂机器学习方法描述的基本数学符号。

 

算术符号

在本节中,我们将重温一些基础算数中你不太熟悉的符号,以及毕业之后一些可能遗忘的概念。

 

简单算术

算术的基本符号你已很熟悉。例如:

加法:1 + 1 = 2

减法:2 – 1 = 1

乘法:2 x 2 = 4

除法:2 / 2 = 1

 

大多数的数学运算都有一个对应的逆运算,进行相反的运算过程;比如,减法是加法的逆运算,而除法是乘法的逆运算。

 

代数

我们常希望用更抽象的方式来描述运算过程,以将其与具体的数据或运算区分开来。因此代数的运用随处可见:也就是用大写和/或小写字母来代表一个项,或者一个数学符号体系中的概念。用希腊字母来代替英文字母也是很常见的用法。数学中的每一个领域都可能有一些保留字母,这些字母都会代表一个特定的东西。尽管如此,代数中的项总应在描述中被定义一下,如果作者没有去定义,那是他的问题,不是你的错。

 

乘法符号

乘法是一个常见的符号,有几种记法。一般是用一个小小的「ⅹ」或者星号「*」来代表乘法:

c = a x b

c = a * b

 

你有时也会看到用一个点来代表乘法,比如:

c = a . b

 

这个式子其实和下式是一样的意思:

c = a x b

 

或者你可能会看到运算符被省略,先前被定义的代数项之间没有符号也没有空格,比如:

c = ab

 

这还是一样的意思。

 

指数和平方根

指数就是一个数字的幂次。这个符号写作正常大小的原数(底数)以及一个上标数(指数),例如:

2^3

 

这个表达式的计算结果就是 3 个 2 连乘,或者说是 2 的立方:

2 x 2 x 2 = 8

 

求一个数的幂,就默认是求它的平方。

2^2 = 2 x 2 = 4

 

平方运算的效果可以用开方来逆转。开方在数学中是在被开方的数字上面加一个开方符号,这里简单起见,直接用「sqrt()」函数来表示了。

sqrt(4) = 2

 

式中,我们知道了指数的结果 4,以及指数的次数 2,我们想算出指数的底数。事实上,开方运算可以是任意次指数的逆运算,只是开方符号默认次数为 2,相当于在开方符号的前面有一个下标的 2。我们当然可以试着写出立方的逆运算,也就是开立方符号:

2^3 = 8

3 sqrt(8) = 2

 

对数和 e

当我们求 10 的整数次幂的时候,我们常称之为数量级。

10^2 = 10 x 10 or 100

 

对这个运算求逆的另一方法是求这个运算结果(100)以 10 为底数的对数;用符号来表达的话就写作 log10()。

log10(100) = 2

 

这里,我们已知指数的结果和底数,而要求指数的次数。这让我们在数量级上轻松地缩放。除此之外,由于计算机中使用二进制数学,求以 2 为底数的对数也是常用的运算。例如:

2^6 = 64

log2(64) = 6

 

还有一个非常常见的对数是以自然底数 e 为底数的。符号 e 是一个专有符号,代表一个特殊的数字或者说一个称为欧拉数的常数。欧拉数是一个无限不循环小数,可以追溯到无穷的精度。

e = 2.71828...

 

求 e 的幂被称为自然指数函数:

e^2 = 7.38905...

 

求自然对数的运算就是这个运算的逆运算,记作 ln():

ln(7.38905...) = 2

 

忽略更多数学细节,自然指数和自然对数在数学中非常有用,因为它们能用来抽象地描述某一系统的持续增长,比如说复利这样的指数级增长体系。

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
还在萌芽期的AI,该如何成长?
还在萌芽期的AI,该如何成长?

AI一方面要脚踏实地,可借用现有的一些平台、硬件先行切入。另一方面AI还将长期处于长跑阶段,技术仍未定型,未来将出现类人脑和量子计算的芯片。

人工智能会替代多少人力劳动?

一眼望过去,一排排的电脑屏幕上,都是类似的画面。也许是因为窗帘的遮光效果太好,略显昏暗的办公环境加上电脑屏幕上被放大的各种物体细节,颇为惊悚。 在某人工智能研究院看到这一幕,不觉惊叹即使是头部的AI创业公司,最关键的一环依然是从数据标注员开始的。

华为“达芬奇计划”:AI芯片如何发力手机

近日,华为公布了自己的“达芬奇计划”,其中提到华为将重点研发AI芯片,作为支持云中的语音和图像识别的基础,这是华为涉足人工智能市场走得非常关键的一部棋。

都在做AI芯片,到底会滋生多少泡沫

人工智能正在改变各行各业,而芯片是实现人工智能的载体。

人工智能实力,中国当真超越美国?

当你在搜索网站上输入“AI”、“美国和中国”这样的关键词时,你会发现,诸如“中国和美国要在AI领域一决胜负”、“中国想要超越美国在AI领域的领先地位”和“AI军备竞赛:中国和美国竞争大数据主宰权”这样的新闻标题,扑面而来。

更多资讯
我国半导体产业发展落后,投资机会众多
我国半导体产业发展落后,投资机会众多

中国作为全球半导体最大的消费市场,年进口金额在1700-1900亿美元,考虑到自主可控以及半导体作为本国经济增长的新兴产业代表,大力发展本土半导体行业势在必行,其中存在的投资机会确定性很高,且未来的景气周期较长。投资者如何去把握行业性的长期投资机会,本文粗略谈谈,抛砖引玉。

机器人有何底气进入安防市场?

和其它服务机器人类似,安防机器人内置摄像头,GPS技术,机器视觉和语音交互等人工智能技术。但光从称呼出发,我们就能了解安防机器人与服务机器人大不相同。

云计算安全谁来负责?怎么负责?

如今,英国几乎所有(88%)组织都采用了云计算技术,这与2012年相比大幅增加,当时只有一半以上。这不可避免地导致了存储在云中的客户数据量的增加,以支持从在线服务和网站到销售和基础设施的所有内容。保持这些数据安全对于企业的顺利运营和客户保护至关重要。

当机器人有了人造神经,就能真实感觉到你?

电影《机器管家》里的机器人管家安德鲁在科学家帮助下,安装了感觉模块,一改往日高冷做派,变得会吃醋,会喊疼,并有了人类的各种“感觉”……如今,电影里的科幻场景正一点一滴地走近现实。

机器人进入安防市场,底气何在?

不同于其它服务机器人的工作理念,安防机器人旨在在人类完全控制下协助人类完成安全防护工作,被广泛用来解决安全隐患、巡逻监控及灾情预警等,出没在险情发生前、中、后期的第一现场。

Moore8直播课堂
电路方案