Home

Awesome

Python 算法与数据结构视频教程

课程简介

数据结构和算法是每个程序员需要掌握的基础知识之一,也是面试中跨不过的槛。目前关于 Python 算法和数据结构的系统中文资料比较欠缺, 笔者尝试录制视频教程帮助 Python 开发者掌握常用算法和数据结构,提升开发技能。 本教程是付费教程(文字内容和代码免费),因为笔者录制的过程中除了购买软件、手写板等硬件之外,业余需要花费很多时间和精力来录制视频、查资料、编写课件和代码,养家糊口不容易,希望大家体谅。

链接

视频教程已经发布在网易云课堂和 csdn 学院,内容一致,推荐使用网易云课堂。

电子书地址:

leetcode 实战图解教程(推荐):

如果您有一定的基础,只是想快速针对面试刷题,也可以直接参考笔者针对《剑指offer》和 leetcode 经典题目的 Python 刷题图解实战。

笔者的其他课程:

痛点

作者简介

曾就职于知乎,现腾讯视频后端工程师,多年 Python/Go 开发经验。

知乎专栏:

电子书:《Python web 入坑指南》

课程内容

包括我们在业务开发和面试中常用的算法和数据结构,希望可以帮助 Python 开发者快速上手,很多老手写业务代码写多了很多基础知识忘记了, 也可以作为回顾。课程尽量用通俗的方式讲解,结合 python 语言和日常开发实践的经验。书中代码可以作为大家的面试笔试参考。 对于每个算法和用到的数据结构我们需要知道:

目录结构

这里讲解的章节我参考了下边教材中列举的一些书籍,并且自己设计了大纲,争取做到循序渐进,简单实用。因为实现一些高级数据结构的时候会用到 很多底层数据结构,防止跳跃太大导致读者理解困难。

课程的目录结构如下,每一章都有配套的文字讲义(markdown),示例代码,视频讲解,详细的讲解一般会放在视频里,使用手写板来 进行板书,包括文字、图示、手动模拟算法过程等。

编程语言

我们这里使用最近很火的Python。Python 入门简单而且是个多面手,在爬虫、web 后端、运维、数据分析、AI、量化投资等领域都有 Python 的身影, 无论是否是专业程序员, Python 都是一门学习性价比非常高的语言。 知乎、豆瓣、头条、饿了么、搜狐等公司都有广泛使用 Python。笔者日常工作使用也是 Python,有一定实践经验, 在知乎上维护了一个专栏《Python 学习之路》

Python 抽象程度比较高, 我们能用更少的代码来实现功能,同时不用像 C/C++ 那样担心内存管理、指针操作等底层问题, 把主要心思放在算法逻辑本身而不是语言细节上,Python 也号称伪代码语言。所有代码示例使用 Python2/3 兼容代码, 不过只在 python3.5 下测试过,推荐用相同版本 Python 进行代码编写和测试。

受众

想要学习 Python 算法和数据结构的中级同学,包括自学的同学和本科低年级学生等。需要掌握 Python 的基本语法和面向对象编程的一些概念,有一定的 Python 使用经验。我们这里尽量只使用最基本的 Python 语法,不会再去介绍用到的 Python 语法糖。 数据结构和算法算是本科教育中偏难的课程,既需要你理解其原理,又需要具有有扎实的编程能力。

请注意: 本教程不是零基础教程,着重于使用 Python 实现常用算法和数据结构,不适合从来没有学过算法和数据结构的新手同学,购买之前请慎重考虑,请确保你之前看过一本数据结构和算法的教材,最好有过其他语言实现算法的经验

预备知识

(注意:有些同学看起来很吃力,为了不花冤枉钱,我建议你先整体浏览本电子书的内容和代码是否在自己的理解范围内,再决定是否购买视频。有些概念不是立马就能理解的,需要反复思考实践)

参考教材和链接

这里我参考过三本书,均可以网购纸质版或者网络上搜索电子版,建议大家先大致阅读一本教材掌握基本原理,本教程重点在于 Pythonic 代码实现:

《算法图解》: 图解的形式很适合新手,示例使用的是 python。推荐基础较少的同学看这本书入门

《Data Structures and Algorithms in Python》: 适合对 Python 和算法比较熟悉的同学,或者是有其他语言编程经验的同学。本书是英文版,缺点是书中错误真的很多,代码有些无法运行而且不够 Pythonic。该书 勘误

《算法导论》第三版: 喜欢数学证明和板砖书的同学可以参考,有很多高级主题。使用伪代码可以很快翻译成 Python

算法可视化

学习算法的过程中有时候会比较抽象,这里给大家推荐一些可视化的网站,方便更直观地理解各种算法和数据结构的执行步骤: 遇到一个算法或数据结构,你可以 google 搜索 "名称+ visualization" 找到一些可视化网站方便理解,比如学习跳跃表的时候笔者就 可以通过 goole "skip list visualization" 搜到一些可视化网站帮助你理解它的工作原理。

讲课形式

绘图演示+手写板+现场编码

我将使用绘图软件+手写板进行类似于纸笔形式的讲解,边讲边开个终端分成两个窗口,一个用 vim 编写代码,另一个窗口用来运行代码,所有代码我将会现场编写(还是很有挑战的)。 每个视频我会尽量控制时长,讲的内容尽量通俗易懂,摆脱学院派的授课方式。

你可以参考我在知乎发的专栏文章看下:

那些年,我们一起跪过的算法题[视频]

抱歉,我是开发,你居然让我写单测[视频]

课程特点

资料

如何获取每章代码

注意每一章目录里都有 py 文件,在电子书里看不到。clone 下本代码仓库找到对应目录里的 python 文件即是每章涉及到的代码。 由于代码实现千差万别,本书代码实现具有一定的个人风格,不代表最佳实现,仅供参考,笔者尽量使用 python2/3 兼容代码。 目前已经新增《剑指offer》大部分经典题目的 Python 解法,每道题目附带leetcode 地址,大家可以自己尝试解决提交。 本项目遵守 MIT 协议,本项目下的所有代码您可以任意学习修改和使用, 但是直接引用代码请加上本项目 github 地址。

如何学习

笔者讲课录制视频的过程也是自己再整理和学习的过程,录制视频之前需要参考很多资料 希望对所讲到的内容,你能够

课程目标

掌握基本的算法和数据结构原理,能独立使用 Python 语言实现,能在日常开发中灵活选用数据结构。 对于找工作的同学提升面试成功率。

开发和测试工具

推荐使用以下工具进行开发,如果使用编辑器最好装对 应 Python 插件,笔者视频演示中使用了 vim,读者可以自己挑选自己喜欢的开发工具:

注意视频中使用到了 pytest 测试框架和 when-changed 文件变动监控工具(方便我们修改完代码保存后自动执行测试),你需要用 pip 安装

pip install pytest
pip install when-changed

视频演示里我使用到了一个简单的 test.sh 脚本文件,内容如下:

#!/usr/bin/env bash

# pip install when-changed, 监控文件变动并且文件修改之后自动执行 pytest 单测,方便我们边修改边跑测试
 when-changed -v -r -1 -s ./    "py.test -s $1"

将以上内容放到 test.sh 文件后加上可执行权限, chmod +x test.sh,之后就可以用

'./test.sh somefile.py'

每次我们改动了代码,就会自动执行代码里的单元测试了。pytest 会自动发现以 test 开头的函数并执行测试代码。良好的工程需要我们用单测来保证,将来即使修改了内部实现逻辑也方便做回归验证。

或者你可以在的 ~/.bashrc or ~/.zshrc 里边加上这个映射(别忘记加上之后source下):

# 监控当前文件夹文件变动自动执行命令
alias watchtest='when-changed -v -r -1 -s ./ '

然后在你的代码目录里头执行 watchtest pytest -s somefile.py 一样的效果

测试用例设计

笔者在刚学习编程的时候总是忘记处理一些特例(尤其是动态语言可以传各种值),为了养成良好的编程和测试习惯,在编写单元测试用例的时候, 我们注意考虑下如下测试用例(等价类划分):

def binary_search(array, target):
    if not array:
        return -1
    beg, end = 0, len(array)
    while beg < end:
        mid = beg + (end - beg) // 2  # py3
        if array[mid] == target:
            return mid
        elif array[mid] > target:
            end = mid
        else:
            beg = mid + 1
    return -1


def test():
    """
    如何设计测试用例:
    - 正常值功能测试
    - 边界值(比如最大最小,最左最右值)
    - 异常值(比如 None,空值,非法值)
    """
    # 正常值,包含有和无两种结果
    assert binary_search([0, 1, 2, 3, 4, 5], 1) == 1
    assert binary_search([0, 1, 2, 3, 4, 5], 6) == -1
    assert binary_search([0, 1, 2, 3, 4, 5], -1) == -1
    # 边界值
    assert binary_search([0, 1, 2, 3, 4, 5], 0) == 0
    assert binary_search([0, 1, 2, 3, 4, 5], 5) == 5
    assert binary_search([0], 0) == 0

    # 异常值
    assert binary_search([], 1) == -1

当然我们也不用做的非常细致,要不然写测试是一件非常繁琐累人的事情,甚至有时候为了测试而测试,只是为了让单测覆盖率好看点。 当然如果是web应用用户输入,我们要假设所有的参数都是不可信的。 但是很多内部调用的函数我们基于约定来编程,如果你瞎传参数,那就是调用者的责任了。

勘误

输出其实也是一种再学习的过程,中途需要查看大量资料、编写讲义、视频录制、代码编写等,难免有疏漏甚至错误之处。 有出版社找过笔者想让我出书,一来自己对出书兴趣不大,另外感觉书籍相对视频不够直观,有错误也不能及时修改,打算直接把所有文字内容讲义和代码等放到 github 上,供大家免费查阅。

如果你发现文字内容、代码内容、视频内容有错误或者有疑问,欢迎在 github 上提 issue 讨论(或者网易公开课评论区),或者直接提 Merge Request,我会尽量及时修正相关内容,防止对读者产生误导。 同时非常感谢认真学习并及时发现书中错误的同学,非常欢迎针对知识本身的交流和讨论,任何建议和修正我都会认真求证。 对于提出修正意见或者提交代码的同学,由于人数比较多这里就不一一列举了,可以在以下列表查看,再次感谢你们。笔者信奉开源精神,『眼睛足够多,bug 无处藏』。 如果您发现视频中的代码有误,请及时使用 git pull 拉取本项目的代码更新,最好用目前最新的代码来学习和实践。

issue

contributors

如何更新代码(写给不熟悉 git 的同学)

如果你直接 clone 的本项目的代码仓库,可以直接使用 git pull origin master 拉取更新。 如果你先 fork 到了自己的仓库,然后 clone 到本地的是你自己的仓库,你可以编辑本地项目的 .git/config, 增加如下配置:

[remote "pegasuswang"]
	url = https://github.com/PegasusWang/python_data_structures_and_algorithms.git
	fetch = +refs/heads/*:refs/remotes/origin/*

然后使用 git pull pegasuswang master 拉取更新。

如何提问?

如果读者关于代码、视频、讲义有任何疑问,欢迎一起讨论 请注意以下几点:

本电子书制作和写作方式

使用 mkdocs 和 markdown 构建,使用 Python-Markdown-Math 完成数学公式。 markdown 语法参考:http://xianbai.me/learn-md/article/about/readme.html

安装依赖:

pip install mkdocs    # 制作电子书, http://markdown-docs-zh.readthedocs.io/zh_CN/latest/
# https://stackoverflow.com/questions/27882261/mkdocs-and-mathjax/31874157
pip install https://github.com/mitya57/python-markdown-math/archive/master.zip

# 或者直接
pip install -r requirements.txt

# 如果你 fork 了本项目,可以定期拉取主仓库的代码来获取更新,目前还在不断更新相关章节

你可以 clone 本项目后在本地编写和查看电子书:

mkdocs serve     # 修改自动更新,浏览器打开 http://localhost:8000 访问
# 数学公式参考 https://www.zybuluo.com/codeep/note/163962
mkdocs gh-deploy    # 部署到自己的 github pages

扫码加入课程:

扫码加入课程