Python之路【第二十四篇】Python算法排序一_weixin_30735391的博客-程序员秘密

技术标签: python  shell  数据结构与算法  

什么是算法

1、什么是算法

算法(algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。

mark:我们可以把所有的算法想象为一本“菜谱”,特定的算法比如菜谱中的的一道“老醋花生米”的制作流程,只要按照菜谱的要求制作老醋花生米,那么谁都可以做出一道好吃的老醋花生米。so,这个做菜的步骤就可以理解为:“解决问题的步骤”

2、算法的意义

假设计算机无限快,并且计算机存储容器是免费的,我们还需要各种乱七八糟的算法吗?如果计算机无限快,那么对于某一个问题来说,任何一个都可以解决他的正确方法都可以的!

当然,计算机可以做到很快,但是不能做到无限快,存储也可以很便宜但是不能做到免费。

那么问题就来了效率:解决同一个问题的各种不同算法的效率常常相差非常大,这种效率上的差距的影响往往比硬件和软件方面的差距还要大。

3、如何选择算法

第一首先要保证算法的正确性

一个算法对其每一个输入的实例,都能输出正确的结果并停止,则称它是正确的,我们说一个正确的算法解决了给定的计算问题。不正确的算法对于某些输入来说,可能根本不会停止,或者停止时给出的不是预期的结果。然而,与人们对不正确算法的看法想反,如果这些算法的错误率可以得到控制的话,它们有时候也是有用的。但是一般而言,我们还是仅关注正确的算法!

第二分析算法的时间复杂度

算法的时间复杂度反映了程序执行时间随输入规模增长而增长的量级,在很大程度上能很好反映出算法的好坏。

时间复杂度

1、什么是时间复杂度

一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)
一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n)),称O(f(n)) 为算法的渐进时间复杂度,简称时间复杂度。

2、时间复杂度的计算方法

一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试因为该方法有两个缺陷:

  • 想要对设计的算法的运行性能进行测评,必须先依据算法编写相应的程序并实际运行。
  • 所得时间的统计计算依赖于计算机的硬件、软件等环境因素,有时候容易掩盖算法的本身优势。

所以只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。

 

一般情况下,算法的基本操作重复执行的次数是模块n的某一个函数f(n),因此,算法的时间复杂度记做:T(n)=O(f(n))。随着模块n的增大,算法执行的时间的增长率和f(n)的增长率成正比,所以f(n)越小,算法的时间复杂度越低,算法的效率越高。 

 在计算时间复杂度的时候,先找出算法的基本操作,然后根据相应的各语句确定它的执行次数,再找出T(n)的同数量级(它的同数量级有以下:1,Log2n ,n ,nLog2n ,n的平方,n的三次方,2的n次方,n!),找出后,f(n)=该数量级,若T(n)/f(n)求极限可得到一常数c,则时间复杂度T(n)=O(f(n))。

3、常见的时间复杂度

常见的算法时间复杂度由小到大依次为:

Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)<…<Ο(2n)<Ο(n!)

 求解算法的时间复杂度的具体步骤:

  • 找出算法中的基本语句,算法中执行最多的那条语句是基本语句,通常是最内层循环的循环体。
  • 计算基本语句的执行次数的量级,保证最高次幂正确即可查看他的增长率。
  • 用大O几号表示算法的时间性能

 如果算法中包含镶套的循环,则基本语句通常是最内层的循环体,如果算法中包并列的循环,则将并列的循环时间复杂度相加,例如:

#!/usr/bin/env python
#-*- coding:utf-8 -*-
__author__ = 'luotianshuai'

n = 100

for i in range(n):
    print(i)


for i in range(n): ##每循i里的一个元素,for循环内部嵌套的for循环就整个循环一次
    for q in range(n):
        print(q)

第一个for循环的时间复杂度为Ο(n),第二个for循环的时间复杂度为Ο(n2),则整个算法的时间复杂度为Ο(n+n2)=Ο(n2)。

Ο(1)表示基本语句的执行次数是一个常数,一般来说,只要算法中不存在循环语句,其时间复杂度就是Ο(1)。

其中Ο(log2n)、Ο(n)、 Ο(nlog2n)、Ο(n2)和Ο(n3)称为多项式时间,而Ο(2n)和Ο(n!)称为指数时间,计算机科学家普遍认为前者(即多项式时间复杂度的算法)是有效算法,把这类问题称为P(Polynomial,多项式)类问题,而把后者(即指数时间复杂度的算法)称为NP(Non-Deterministic Polynomial, 非确定多项式)问题在选择算法的时候,优先选择前者!

 

OK我懂对于没有算法基础的同学,看起算法来也很头疼,但是这个是基础和重点,不会算法的开发不是一个合格的开发并且包括语言记得基础也是需要好好整理的!加油吧~~  咱们在一起看下时间复杂度的详细说明吧

常见的时间复杂度示例

1、O(1)

#O(1)

n = 100 
sum = (1+n) * n/2 #执行一次
sum_1 = (n/2) - 10 #执行一次
sum_2 = n*4 - 10 + 8 /2 #执行一次

这个算法的运行次数函数是f(n)=3。根据我们推导大O阶的方法,第一步就是把常数项3改为1。在保留最高阶项时发现,它根本没有最高阶项,所以这个算法的时间复杂度为O(1)。

并且:如果算法的执行时间不随着问题规模n的增长而增加,及时算法中有上千条语句,其执行的时间也不过是一个较大的常数。此类算法的时间复杂度记作O(1)

2、O(n2)

n = 100 

for i in range(n): #执行了n次
    for q in range(n): #执行了n2
        print(q) #执行了n2

解:T(n)=2n2+n+1 =O(n2)

一般情况下,对进循环语句只需考虑循环体中语句的执行次数,忽略该语句中步长加1、终值判别、控制转移等成分当有若干个循环语句时,算法的时间复杂度是由嵌套层数最多的循环语句中最内层语句的频度f(n)决定的。  

3、O(n)   

#O(n)

n =100 
a = 0 #执行一次
b = 1#执行一次
for i in range(n): #执行n次
    s = a +b #执行n-1次
    b =a #执行n-1次
    a =s #执行n-1次

解:T(n)=2+n+3(n-1)=4n-1=O(n)

4、Ο(n3)

#O(n3)
n = 100
for i in range(n):#执行了n次
    for q in range(n):#执行了n^2
        for e in range(n):#执行了n^3
            print(e)#执行了n^3

简单点来去最大值是:Ο(n3)

5、常用的算法的时间复杂度和空间复杂度

排序法 平均时间 最差情况 稳定度 额外空间 备注
冒泡排序 Ο(n2) Ο(n2) 稳定 O(1) n小时较好
交换排序 Ο(n2) Ο(n2) 不稳定 O(1) n小时较好
选择排序 Ο(n2) Ο(n2) 不稳定 O(1) n小时较好
插入排序 Ο(n2) Ο(n2) 稳定 O(1) 大部分已排序时较好
快速排序 Ο(nlogn) Ο(n2) 不稳定 Ο(nlogn) n较大时较好
希尔排序(SHELL) Ο(log2n) Ο(ns)  1<s<2
不稳定 O(1) s是所选分组
归并排序 Ο(log2n) Ο(log2n) 稳定 O(1) n大时较好
堆排序 Ο(log2n) Ο(log2n) 不稳定 O(1) n大时较好
基数排序 Ο(logRB) Ο(logRB) 稳定 O(N)

B是真数(0-9)

R是基数(个十百)

 

 

 

 

 

 

 

 

 

 

 

排序实例

排序算法是在更复杂的算法中的是一个构建基础,所以先看下常用的排序。

1、冒泡排序

需求:

请按照从小到大对列表,进行排序==》:[69, 471, 106, 66, 149, 983, 160, 57, 792, 489, 764, 589, 909, 535, 972, 188, 866, 56, 243, 619] 

思路:相邻两个值进行比较,将较大的值放在右侧,依次比较!

原理图:

原理分析:

列表中有5个元素两两进行比较,如果左边的值比右边的值大,就用中间值进行循环替换!
既然这样,我们还可以用一个循环把上面的循环进行在次循环,用表达式构造出内部循环!

代码实现:

#!/usr/bin/env python
#-*- coding:utf-8 -*-
__author__ = 'luotianshuai'
import random

maopao_list = [13, 22, 6, 99, 11]
'''
原理分析:
列表中有5个元素两两进行比较,如果左边的值比右边的值大,就用中间值进行循环替换!
既然这样,我们还可以用一个循环把上面的循环进行在次循环,用表达式构造出内部循环!
'''

def handler(array):
    for i in range(len(array)):
        for j in range(len(array)-1-i):
            '''
            这里为什么要减1,我们看下如果里面有5个元素我们需要循环几次?最后一个值和谁对比呢?对吧!所以需要减1
            这里为什么减i?,这个i是循环的下标,如果我们循环了一次之后最后一只值已经是最大的了还有必要再进行一次对比吗?没有必要~
            '''
            print('left:%d' % array[j],'right:%d' % array[j+1])
            if array[j] > array[j+1]:
                tmp = array[j]
                array[j] = array[j+1]
                array[j+1] = tmp



if __name__ == '__main__':
    handler(maopao_list)
    print(maopao_list)

时间复杂度说明看下他的代码复杂度会随着N的增大而成指数型增长,并且根据判断他时间复杂度为Ο(n2)

2、选择排序

需求:

请按照从小到大对列表,进行排序==》:[69, 471, 106, 66, 149, 983, 160, 57, 792, 489, 764, 589, 909, 535, 972, 188, 866, 56, 243, 619] 

思路:

第一次,从列表最左边开始元素为array[0],往右循环,从右边元素中找到小于array[0]的元素进行交换,直到右边循环完之后。

第二次,左边第一个元素现在是最小的了,就从array[1],和剩下的array[1:-1]内进行对比,依次进行对比!

对比:

他和冒泡排序的区别就是,冒泡排序是相邻的两两做对比,但是选择排序是左侧的“对比元素”和右侧的列表内值做对比!

原理图:

代码实现:

#!/usr/bin/env python
#-*- coding:utf-8 -*-
__author__ = 'luotianshuai'


xuanze_list = [13, 22, 6, 99, 11]

print(range(len(xuanze_list)))

def handler(array):
    for i in range(len(array)):
        '''
        循环整个列表
        '''
        for j in range(i,len(array)):
            '''
            这里的小循环里,循环也是整个列表但是他的起始值是i,当这一个小循环完了之后最前面的肯定是已经排序好的
            第二次的时候这个值是循环的第几次的值比如第二次是1,那么循环的起始值就是array[1]
            '''
            if array[i] > array[j]:
                temp = array[i]
                array[i] = array[j]
                array[j] = temp
        # print(array)


if __name__ == '__main__':
    handler(xuanze_list)
    print(xuanze_list)

选择排序代码优化:

#!/usr/bin/env python
#-*- coding:utf-8 -*-
__author__ = 'luotianshuai'

import random
import time


def handler(array):
    for i in range(len(array)):
        smallest_index = i  #假设默认第一个值最小
        for j in range(i,len(array)):
            if array[smallest_index] > array[j]:
                smallest_index = j  #如果找到更小的,记录更小元素的下标
        '''
        小的循环结束后在交换,这样整个小循环就之前的选择排序来说,少了很多的替换过程,就只替换了一次!提升了速度
        '''
        tmp = array[i]
        array[i] = array[smallest_index]
        array[smallest_index] = tmp


if __name__ == '__main__':
    array = []
    old_time = time.time()
    for i in range(50000):
        array.append(random.randrange(1000000))
    handler(array)
    print(array)
    print('Cost time is :',time.time() - old_time)

3、插入排序

需求

请按照从小到大对列表,进行排序==》:[69, 471, 106, 66, 149, 983, 160, 57, 792, 489, 764, 589, 909, 535, 972, 188, 866, 56, 243, 619] 

思路:

一个列表默认分为左侧为排序好的,我们拿第一个元素举例,他左边的全是排序好的,他右侧是没有排序好的,如果右侧的元素小于左侧排序好的列表的元素就把他插入到合适的位置

原理图:

 

代码实现:

#!/usr/bin/env python
#-*- coding:utf-8 -*-
__author__ = 'luotianshuai'


import random
import time
chaoru_list = [69, 471, 106, 66, 149, 983, 160, 57, 792, 489, 764, 589, 909, 535, 972, 188, 866, 56, 243, 619]

def handler(array):
    for i in range(1,len(array)):
        position = i #刚开始往左边走的第一个位置
        current_val = array[i] #先把当前值存下来
        while position > 0 and current_val < array[position -1]:
            '''
            这里为什么用while循环,咱们在判断左边的值得时候知道他有多少个值吗?不知道,所以用while循环
            什么时候停下来呢?当左边没有值得时候,或者当他大于左边的值得时候!
            '''
            array[position] = array[position - 1] #如果whille条件成立把当前的值替换为他上一个值
            '''
            比如一个列表:
            [3,2,4,1]
            现在循环到 1了,他前面的元素已经循环完了
            [2,3,4] 1

            首先我们记录下当前这个position的值 = 1
            [2,3,4,4] 这样,就出一个位置了
            在对比前面的3,1比3小
            [2,3,3,4] 在替换一下他们的值
             在对比2
            [2,2,3,4]
            最后while不执行了在进行替换'array[position] = current_val  #把值替换'
            '''
            position -= 1
        #当上面的条件都不成立的时候{左边没有值/左边的值不比自己的值小}
        array[position] = current_val  #把值替换


if __name__ == '__main__':
    handler(chaoru_list)
    print(chaoru_list)

'''
    array = []#[69, 471, 106, 66, 149, 983, 160, 57, 792, 489, 764, 589, 909, 535, 972, 188, 866, 56, 243, 619]
    old_time = time.time()
    for i in range(50000):
        array.append(random.randrange(1000000))
    handler(array)
    print(array)
    print('Cost time is :',time.time() - old_time)
'''

4、快速排序

设要排序的数组是A[0]……A[N-1],首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。值得注意的是,快速排序不是一种稳定的排序算法,也就是说,多个相同的值的相对位置也许会在算法结束时产生变动.他的时间复杂度是:O(nlogn) ~Ο(n2)

排序示例:

假设用户输入了如下数组:

创建变量i=0(指向第一个数据)[i所在位置红色小旗子], j=5(指向最后一个数据)[j所在位置蓝色小旗子], k=6(赋值为第一个数据的值)。

我们要把所有比k小的数移动到k的左面,所以我们可以开始寻找比6小的数,从j开始,从右往左找,不断递减变量j的值,我们找到第一个下标3的数据比6小,于是把数据3移到下标0的位置,把下标0的数据6移到下标3,完成第一次比较:

i=0 j=3 k=6

接着,开始第二次比较,这次要变成找比k大的了,而且要从前往后找了。递加变量i,发现下标2的数据是第一个比k大的,于是用下标2的数据7和j指向的下标3的数据的6做交换,数据状态变成下表:

 i=2 j=3 k=6

称上面两次比较为一个循环。
接着,再递减变量j,不断重复进行上面的循环比较。
在本例中,我们进行一次循环,就发现i和j“碰头”了:他们都指向了下标2。于是,第一遍比较结束。得到结果如下,凡是k(=6)左边的数都比它小,凡是k右边的数都比它大:

如果i和j没有碰头的话,就递加i找大的,还没有,就再递减j找小的,如此反复,不断循环。注意判断和寻找是同时进行的。

然后,对k两边的数据,再分组分别进行上述的过程,直到不能再分组为止。
注意:第一遍快速排序不会直接得到最终结果,只会把比k大和比k小的数分到k的两边。为了得到最后结果,需要再次对下标2两边的数组分别执行此步骤,然后再分解数组,直到数组不能再分解为止(只有一个数据),才能得到正确结果。

代码实现:

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author:luotianshuai
import random
import time

def quick_sort(array,start,end):
    if start >= end:
        return
    k = array[start]
    left_flag = start
    right_flag = end
    while left_flag < right_flag:
        '''
        left_flag = start 默认为0
        right_flag = end 默认为传来的列表总长度
        当left_flag 小与right_flag的时候成立,说明左右两边的小旗子还没有碰头(为相同的值)
        '''
        #右边旗子
        while left_flag < right_flag and array[right_flag] > k:#代表要继续往左一移动小旗子
            right_flag -= 1
        '''
        如果上面的循环停止说明找到右边比左边的值小的数了,需要进行替换
        '''
        tmp = array[left_flag]
        array[left_flag] = array[right_flag]
        array[right_flag] = tmp

        #左边旗子
        while left_flag < right_flag and array[left_flag] <= k:
            #如果没有找到比当前的值大的,left_flag 就+=1
            left_flag += 1
        '''
        如果上面的循环停止说明找到当前段左边比右边大的值,进行替换
        '''
        tmp = array[left_flag]
        array[left_flag] = array[right_flag]
        array[right_flag] = tmp

    #进行递归把问题分半
    quick_sort(array,start,left_flag-1)
    quick_sort(array,left_flag+1,end)

if __name__ == '__main__':
    array = []  # [69, 471, 106, 66, 149, 983, 160, 57, 792, 489, 764, 589, 909, 535, 972, 188, 866, 56, 243, 619]
    start_time = time.time()
    for i in range(50000):
        array.append(random.randrange(1000000))
    quick_sort(array,0,len(array)-1)
    end_time = time.time()
    print(array)
    print(start_time,end_time)
    cost_time = end_time - start_time
    print('Cost time is :%d' % cost_time)

 

转载于:https://www.cnblogs.com/luotianshuai/p/5545405.html

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_30735391/article/details/98599263

智能推荐

SpringBoot最小项目的pom文件_springboot pom 最小_superfreak的博客-程序员秘密

访问https://start.spring.io/,新建一个项目,只有SpringWeb 一个依赖,让我们看看这个时候的pom文件内容。这个时候打开这个项目,pom文件如下:&lt;?xml version="1.0" encoding="UTF-8"?&gt;&lt;project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:sch

旧版sai笔刷_漂亮的sai笔刷大全(ps笔刷包) 简化中文版_Jack.qiu的博客-程序员秘密

漂亮的sai笔刷大全(ps笔刷包)是一款非常实用的ps笔刷。它是一些预设的图案,可以根据自己的喜好选择充当画笔,达到自己的图像编辑目的,小编带来的这套完整版希望大家喜欢。感兴趣的朋友欢迎前来下载体验吧!PS笔刷介绍笔刷是图像编辑软件photoshop中的一个工具之一,它是一些预设的图案,可以以画笔的形式直接使用。相关介绍网上有许多Photoshop笔刷供下载,下面就来看安装和使用Photoshop...

yii中 注册后需要邮件激活才可以访问 但激活后还是显示未登录_liangpz521的博客-程序员秘密

问题描述:现实现一注册功能,注册完成后会向用户注册的邮箱发一份激活链接,只有激活的邮箱才可以正常登录!激活代码是这样写的://通过邮件激活账号后不经过登录页直接登录 public function autoauthen($email){ $user_model = User::model()->find('email=:name and email_verified=

win32汇编调用win32控制台API示例_bcbobo21cn的博客-程序员秘密

2.asm;.386.model flat, stdcalloption casemap :none include S:\masm32\include\windows.incinclude S:\masm32\include\user32.incinclude S:\masm32\include\kernel32.incinclude S:\masm32\include\gdi32.incincludelib S:\masm32\lib\user32.libincludelib S

基于el-table-infinite-scroll实现表格数据无限加载的功能_表格无限滚动加载组件_骑上我心爱的小摩托的博客-程序员秘密

当表格组件的翻页不想局限通用的Pagination,也可结合无限滚动进行浏览加载数据主要是注意的绑定方法load的使用,以及disabled和有问题欢迎提问和私信,觉得有帮助的话,给个赞或者关注吧~

.NET 安全开发_weixin_34150830的博客-程序员秘密

简介:CSDN是chinese software develop net 的缩写 ,中国软件开发联盟。中国最大的开发者技术社区 ---- 《程序员》刊物 官方网站它是集 新闻、论坛、群组、Blog、文档、下载、读书、Tag、网摘、搜索、.NET、Java、游戏、视频、人才、外包、第二书店、《程序员》等多种项目于一体的大型综合性IT门户网站,它有非常强的专业性,其会员囊括了中国地区百分之九十以上...

随便推点

我的软考经验分享_软考论坛_qiangw09的博客-程序员秘密

软考的全称是“计算机技术与软件技术资格(水平)考试”,这个在人事考试网报名被劳动部认可的证书在很多公司单位和职称是有联系的,所以每年两次的考试也有很多人报名参考。我在很多次表达过我终于在6次报名,4次参考,第二次报名并参考信息系统项目管理师之后,通过了考试拿到了证书。软考报名分初级中级和高级,具体报考条件可以去人事考试网站上查看,我也不是十分清楚,嘻嘻。我最初的四次考试都报名的是中级,...

干货:java之jdk命令行工具详解。_诸葛_孔明的博客-程序员秘密

在上一篇文章中整理了java开发人员必须掌握的linux基本命令。由于java jdk命令行工具比较重要所以单独整理一个篇幅来讲解。相关资料有来源于网络、加上自己的见解整理而成、比较全面。上一篇文章地址:Java开发必须熟悉的Linux命令看这一篇就够了。 在笔者接触的很多公司中、发现很多java开发人员一旦发现应用无法响应、首先查看一下日志、在查找日志无果的情况下动不动就重启java应用先让其...

HTML5 植物大战僵尸项目介绍 和源码分析_洛阳泰山的博客-程序员秘密

项目目录images 包含项目中所有植物和僵尸和场景,的图片js文件夹下是游戏控制的js文件level 是游戏关卡的js控制文件music 文件夹 游戏背景音乐index.html 游戏面板的主页代码如下&lt;html&gt;&lt;head&gt;&lt;meta http-equiv="Content-Type" content="text/html; charset=UTF-8"&gt;&lt;meta name="KeyWord...

php分解质因数,用PHP可以实现将一个正整数分解为质因数的积么?_weixin_39962770的博客-程序员秘密

//判断是否为素数 若是素数返回1,否返回0function checkSS($num){if($num&gt;0 &amp;&amp; is_numeric($num) &amp;&amp; is_int($num)){$flag = 1;for($i=2;$iif($num % $i == 0 &amp;&amp; $num!=2){$flag = 0;}}}else{echo "请输入非0整...

SDE安装 esri_sde service failed during initialization._删除sde服务_ouailuo143的博客-程序员秘密

原因:该错误出现在ArcSDE不正确或不完整的安装或配置。解决方法:确保输入正确的SDE用户密码,如果密码不正确,会在sde.errlog文件出现一个“-93”错误。确保完全的删除当前的SDE服务,建立一个新的SDE服务。1:利用SDE命令“sdeservice –o delet

达梦数据库 安装和使用_CheifOfRuleMaker的博客-程序员秘密

目录用命令方式建立数据库达梦数据库的状态4种状态状态切换查看状态启动数据库方式一方式二判断数据库是否启动达梦数据库的体系结构达梦逻辑存储结构达梦的物理存储结构重做日志管理表空间管理表空间介绍增加表空间维护表空间更换存储位置删除表空间用户管理查询有哪些用户如何规划用户规划用户权限用户维护用命令方式建立数据库在达梦的bin目录下使用dminit./dminit path=/dm7/data db_name=

推荐文章

热门文章

相关标签