首页 > 世链号 > 究竟什么是时间复杂度,怎么求时间复杂度,看这一篇就够了
链讯管理局  

究竟什么是时间复杂度,怎么求时间复杂度,看这一篇就够了

摘要:时间复杂度就是用来方便开发者估算出程序的运行时间

来源:CarlSun

究竟什么是时间复杂度

时间复杂度就是用来方便开发者估算出程序的运行时间

我们该如何估计程序运行时间呢,我们通常会估计算法的操作单元数量,来代表程序消耗的时间, 这里我们默认 CPU 的每个单元运行消耗的时间都是相同的。

假设算法的问题规模为 n,那么操作单元数量便用函数 f(n) 来表示

随着数据规模 n 的增大,算法执行时间的增长率和 f(n) 的增长率相同,这称作为算法的渐近时间复杂度,简称时间复杂度,记为 O(f(n))

什么是大 O

这里就要说一下这个大 O,什么是大 O 呢,很多同学说时间复杂度的时候都知道 O(n),O(n^2),但说不清什么是大 O

算法导论给出的解释:大 O 用来表示上界的,当用它作为算法的最坏情况运行时间的上界,就是对任意数据输入的运行时间的上界。

同样算法导论给出了例子:拿插入排序来说,插入排序的时间复杂度我们都说是 O(n^2)

但是在数据本来有序的情况下时间复杂度是 O(n),也就对于所有输入情况来说,最坏是 O(n^2) 的时间复杂度,所以称插入排序的时间复杂度为 O(n^2)

同样的同理我们在看一下快速排序,都知道快速排序是 O(nlogn),但是当数据已经有序情况下,快速排序的时间复杂度是 O(n^2) 的,严格从大 O 的定义来讲,快速排序的时间复杂度应该是 O(n^2)

但是我们依然说快速排序是 O(nlogn) 的时间复杂度,这个就是业内的一个默认规定,我们这里说的 O 代表的就是一般情况,不是严格的上界

究竟什么是时间复杂度,怎么求时间复杂度,看这一篇就够了

所以这里大家知道这么一回事就好了

面试中面试官绝对不会针对快速排序的时间复杂度问题来讨论 O 的定义, 大家知道讨论的时间复杂度就是指一般情况下的时间复杂度就好了。

大家要对算法的时间复杂度有这样的一个概念

就是同一个算法的时间复杂度不是一成不变的,和输入的数据形式依然有关系

我们主要关心的还是一般情况下的数据形式。

面试中说道算法的时间复杂度是多少指的都是一般情况

但是如果面试官和我们深入探讨一个算法的实现以及性能的时候 我们就要时刻想着 数据用例的不一样 时间复杂度也是不同的,这一点同学们要注意

如何描述时间复杂度

这个图中我们可以看出 不同算法的时间复杂度 在不同数据输入规模下的差异。

究竟什么是时间复杂度,怎么求时间复杂度,看这一篇就够了

我们在决定使用那些算法的时候 ,不是时间复杂越低的越好,要考虑数据规模,如果数据规模很小 甚至可以用 O(n^2) 的算法比 O(n) 的更合适

就像上图中图中 O(5n^2) 和 O(100n) 在 n 为 20 之前 很明显 O(5n^2) 是更优的,所花费的时间也是最少的。

那我们为什么在计算时间复杂度的时候要忽略常数项系数呢,也就说 O(100n) 就是 O(n) 的时间复杂度,O(5n^2) 就是 O(n^2) 的时间复杂度

而且要默认 O(n) 优于 O(n^2) 呢 ?

这里就又涉及到大 O 的定义

因为大 O 其实就是数据量级突破一个点且数据量级非常大的情况下所表现出的时间复杂度,这个点也就是 常数项系数已经不起决定性作用的点。

例如上图中 20 就是那个点 ,n 只要大于 20 常数项系数已经不起决定性作用了。

所以我们说的时间复杂度都是省略常数项系数的,是因为一般情况下我们都是默认数据规模足够的大,基于这样的事实 我们给出的算法时间复杂的的一个排行如下所示:

O(1) 常数阶 < O(logn) 对数阶 < O(n) 线性阶 < O(n^2) 平方阶 < O(n^3)(立方阶) < O(2^n) (指数阶)

你所不知道的 O(logn)

我们平时说这个算法的时间复杂度是 logn 的,一定是 log 以 2 为底 n 的对数么?

其实不然,也可以是以 10 为底 n 的对数,也可以是以 20 为底 n 的对数,但我们统一说 logn,也就是忽略底数的描述。

为什么可以这么做呢?

如下图所示

究竟什么是时间复杂度,怎么求时间复杂度,看这一篇就够了

假如我们有两个算法的时间复杂度 分别是 log 以 2 为底 n 的对数 和 log 以 10 为底 n 的对数

那么这里如果大家还记得我们高中数学的话,应该不能理解 以 2 为底 n 的对数 = 以 2 为底 10 的对数 乘以 以 10 为底 n 的对数

那这里以 2 为底 10 的对数 是一个常数,而我在上面已经讲述了我们计算时间复杂度是忽略常数项系数的

抽象一下 log 以 i 为底 n 的对数 等于 log 以 j 为底 n 的对数,所以我们忽略了 i,直接说是 logn,正式因为 logij 是就一个常数

所以,这样就应该不难理解了 我们为什么忽略底数了

如果时间复杂度是一个复杂的表达式,我们如何简化

有时候,我们去计算时间复杂度的时候 发现不是一个 简单的 O(n) 或者 O(n^2), 而是一个复杂的表达式,例如:

O(2*n^2 + 10*n + 1000)

那这里我们通常如何描述这个算法的时间复杂度呢,一种方法就是简化法

去掉运行时间中的加法常数项 (因为常数项并不会因为 n 的增大而增加计算机的操作次数)

O(2*n^2 + 10*n)

去掉常数系数 (我们刚刚已经详细讲过为什么可以去掉常数项的原因了)

O(n^2 + n)

只保留保留最高项 去掉数量级小一级的 n (因为 n^2 的数据规模远大于 n),最终简化为:

O(n^2)

如果这一步同学们理解有困难,那也可以做提取 n 的操作,变成 O(n(n+1)) ,省略加法常数项后 也别变成了

O(n^2)

所以最后我们说:我们这个算法的算法时间复杂度是 O(n^2)

也可以用另一种简化的思路,当 n 大于 40 的时候 , 这个复杂度 会一直小于

O(3*n^2)

O(2*n^2 + 10*n + 1000) < O(3*n^2)

所以说 最后我们省略掉常数项系数最终时间复杂度也是 O(n^2)

举例说明时间复杂度要怎么算

我们通过一道题目,来看一下具体时间复杂度应该怎么算

题目描述:找出 n 个字符串中相同的两个字符串(假设这里只有两个相同的字符串)

一些同学可能以为解决这道题目可以采用枚举遍历的解法,时间复杂度是 O(n^2)

这个时间复杂度其实是不对的。

这里一些同学忽略了字符串比较的时间消耗,这里并不像 int 型数字做比较那么简单

除了 n^2 次的遍历次数外, 字符串比较依然要消耗 m 次操作(m 也就是字母串的长度),所以时间复杂度是 O(m*n*n)

那么我们再想一下其他解题思路

我们先排对 n 个字符串按字典序来排序,排序后 n 个字符串就是有序的,意味着两个相同的字符串就是挨在一起

然后在遍历一遍 n 个字符串,这样就找到两个相同的字符串了

那我们来看看这种算法的时间复杂度

快速排序时间复杂度 为 O(nlogn),依然要考虑字符串的长度是 m,那么快速排序每次的比较都要有 m 次的字符比较的操作,就是 O(m*n*logn)

之后我们还要遍历一遍这 n 个字符串找出两个相同的字符串,别忘了遍历的时候依然要比较字符串,所以总共的时间复杂度是 O(m*n*logn + n*m)

我们对 O(m*n*logn + n*m) 进行简化操作,把 m*n 提取出来变成 O(m*n*(logn + 1))

在省略常数项最后的时间复杂度是 O(m*n*logn), 那我们比较一下时间效率 O(m*n*logn) 是不是比第一种方法 O(m*n*n) 更快一些呢

很明显 O(m*n*logn) 要优于 O(m*n*n)

所以 先把字符串集合排序在遍历一遍找到两个相同字符串的方式要比直接暴力枚举的方式更快。

通过这个例子 希望大家对时间复杂的是怎么算的有一个初步的理解和认识。

免责声明
世链财经作为开放的信息发布平台,所有资讯仅代表作者个人观点,与世链财经无关。如文章、图片、音频或视频出现侵权、违规及其他不当言论,请提供相关材料,发送到:2785592653@qq.com。
风险提示:本站所提供的资讯不代表任何投资暗示。投资有风险,入市须谨慎。
世链粉丝群:提供最新热点新闻,空投糖果、红包等福利,微信:juu3644。