随着科学技术的发展,人工智能已经逐渐渗透到各个行业,这是一个相当有前景的专业领域。
其中,算法工程师这一职位更是非常火爆,在急缺大量人才的同时,也吸引了众多求职者,那么,初学者该如何学好算法呢?
算法工程师的具体分支:
其次,算法工程师的必备技能:
▲ 至少熟悉一门编程语言 C/C++/java/python/R;
▲ 功底;熟练运用各种常用算法和数据结构,有独立的实现能力;
▲ 熟悉数据挖掘算法;
▲ 熟悉机器学习相关知识理论。
▲ 加分项:具有较为丰富的项目实践经验。
好奇的你看到这里,肯定带着大大的疑问:是不是要直接学习这些算法呢?
万丈高楼平地起,任何高深的算法都要从基础算法学起,不可能一口吃个胖子。
所以,初入门的你学习算法还是要从基础开始:
▲ 首先学习一门语言。
例如 C/C++/Java/python,初学者学 C++比较普遍。
▲ 学数据结构。
数据结构书有很多,但是有些教材晦涩难懂,建议看图解多,通俗易懂的书,推荐《趣学数据结构》。
▲ 学算法。
不要直接看《算法导论》,大量证明会让你崩溃。推荐《趣学算法》,有问题分析,完美图解,伪码详解,实战演练,适合初学者快速掌握经典算法。
接下来,让我们跟随《趣学数据结构》《趣学算法》作者陈小玉老师的视角,找到学习算法与数据结构的窍门!
01
为什么要学数据结构?
招聘和数据不得不说的故事
如果你关注招聘试题,就会发现越是大公司,问的问题越基础,有的甚至问你什么是栈和队列,反而一些小公司会关心你做过什么系统,关注点不同。
大公司更注重基础扎实,发展潜力,而小公司希望你立刻、马上为他干活,通常是没什么技术含量的活。小公司喜欢细而长的竹子,大公司更喜欢碗口粗的竹笋。
我曾经推荐一个学生到某知名公司,没多久,学生给我说了应聘的事情:“我介绍我开发了企业管理系统、在线商城系统等等,没想到他问我使用了什么数据结构和算法,我懂很多技术,那么多功能我都实现了,他不问,却问我使用了什么数据结构和算法,你说搞笑不?数据结构、算法我早就忘了,我会开发软件还不行吗?”
人力资源总监也反馈过来意见:“很搞笑,这个学生做了不少系统,却说根本没用到数据结构和算法。”
既然双方都觉得这是一个件搞笑事,我们就摊开来看,数据结构到底是什么东西。
拨云见日,看清数据结构
遇到一个实际问题,需要解决两个事情:
(1) 如何将数据存储在计算机中;
(2) 用什么方法策略解决问题。
前者是数据结构,后者是算法。
只有数据结构没有算法,相当于只把数据存储到计算机中而没有有效的方法去处理,就像一幢只有框架的烂尾楼;若只有算法,没有数据结构,就像沙漠里的海市蜃楼,只不过是空中楼阁罢了。
数据是一切能输入到计算机的信息总和,结构是指数据之间的关系,数据结构就是将数据及其之间的关系有效地存储在计算机中。算法是指对特定问题求解步骤的一种描述,说白了就是解决问题的方法策略。
数据结构和算法不依赖于语言,什么语言无所谓。但是如果上机实现的话,就要使用计算机语言。
遇到一个实际问题,充分利用所学的数据结构,将数据及其之间的关系有效地存储在计算机中,然后选择合适的算法策略,并用程序高效实现,这就是N.Wirth 教授所说的:
数据结构+ 算法=程序。
计算机专业本科生都开设数据结构课程,它是计算机学科知识结构的核心和技术体系的基石。
研究生考试也是必考科目,随着科学技术的飞速发展,数据结构的基础性地位不仅没有动摇,反而由于近年来算法工程师的高薪火爆,而得到了业内空前的重视。
很多人觉得基本的数据结构及操作已经在高级语言(如 C++、JAVA 语言中)中封装,栈、队列、排序、优先队列等都可以直接调用库函数,学会怎么调用就好了,干嘛要重复造轮子?
02
学习数据结构有什么用处?
学习数据有效存储的方法
很多学生在学习数据结构时,问我要不要把单链表插入删除代码背下来?要不合上书就不会写了。我非常诧异,为什么要背?理工科技术知识很少需要记忆的,是用的,用的!学习知识不是死记硬背,更重要的是学习处理问题的方法。
同一个问题,如何有效地存储数据,不同的数据结构产生什么样的算法复杂性,有没有更好的存储方法提高算法的效率?
例如,用顺序表查找需要O(n)的时间复杂度,用平衡树查找需要 O(logn)的时间复杂度。这是什么概念呢?就像你有 10 个亿,一觉醒来,兜里只剩下 30 块!
处理具有复杂关系的数据
现实中很多具有复杂关系的数据,无法通过简单的库函数调用实现。专业认证中特别强调培养学生解决复杂工程问题的能力,什么是复杂工程问题?
就是需要综合运用多个知识技术解决的问题。如同现在很多芯片高度集成,完全不需要芯片内部如何,直接使用就行了。
但是,如果在现实中遇到一个复杂问题,一个芯片只能完成其中一个功能,难道要连接十几块芯片来解决这一个问题?
你在搞圣诞树嘛?一个树枝挂个小礼物,叮叮当当的乱响。这显然是不合适的,我们需要的是完成该复杂问题的一个芯片,因此需要运用所学的数据结构知识,高效处理具有复杂关系的数据。
通过学习数据结构,更加准确、深刻地理解不同数据结构之间的共性和联系,学会选择和改进数据结构,高效地设计并实现各种算法,这才是数据结构的精髓。
03
数据结构为什么那么难?
网络上太多的同学吐槽被虐,如滔滔江水连绵不绝,数据结构太难了!真的很难吗?其实数据结构只是讲了三种:线性结构、树、图。到底难在哪里呢?通过调查了解大概有四个原因:
▲ 无法接受的描述方式
数据结构的描述大多是抽象的形式,我们使用自然语言表达习惯了,不容易接受数据结构的抽象表示。
不止一个学生问我,书上的“ElemType”到底是什么类型?运行时怎么提示错误。它的意思就是“元素类型”,只是这样的描述,你需要什么类型就写什么类型,例如 int。这样的表达方式让不少人崩溃。
▲ 不知道什么用处
尽管很多人学习数据结构,有的人是应付考试,有的人考研需要,有的人参加算法竞赛需要,而很多人不太清楚学习数据结构有什么用处,迷迷糊糊看书、做题、考试。
▲ 体会不到其中的妙处
由于教材、教师等等各种因素影响,很多学生没有体会到数据结构处理数据的妙处,经常为学不会而焦头烂额,无法体会其中乐趣,有趣是才有意思,兴趣是最大的驱动力。一旦体会到其中的奥妙,就会有停不下来的感觉。
有读者给我留言,老师看了你的书根本停不下来。其实,我写书的时候也停不下来,神同步。
▲ 语言基础不好
我一直强调先看图解,理清思路,再上机。还是有很多同学已经理解了思路后,因为缺少 main 函数,输入输出格式不对,缺少括号等等各种语言问题卡壳,而这一切统统戴给了“数据结构太难了”这个大帽子。
04
数据结构学习秘籍
在讲学习秘籍之前,首先了解一下数据结构学习的三种境界:
▲ 会数据结构的基本操作
这是最基础的要求,学会各种数据结构的基本操作,取值、查找、插入、删除等。先看图解,理解各种数据结构的定义,操作方法,然后看代码,尝试自己动手上机运行,逐渐掌握基本操作。
初学时,要想理解数据结构,一定要学会画图,通过画图形象表达,更能体会其中的数据结构关系。因此,初学阶段学习利器:画图,理解,画图。
▲ 会利用数据结构,解决实际问题
在掌握了书上的基本操作之后,就可以尝试利用数据结构解决一些实际问题了,先学经典应用问题的解决方法,体会数据结构的使用方法,然后再做题,独立设计数据结构解决问题。
要想熟练应用就必须做大量的题,从做题中体会其中的方法。最好进行专项练习,比如线性表问题,二叉树问题,图问题,该阶段学习利器:做题,反思,做题。
▲ 熟练使用和改进数据结构,优化算法
这是最高境界了,也是学习数据结构的精髓所在,单独学习数据结构是无法达到这种境界的。它需要在学习算法的过程中慢慢修炼。
在学习算法的同时,逐步熟练应用、改进,慢慢体会不同数据结构和算法策略的算法复杂性,最终学会利用数据结构改进和优化算法。
该阶段已经在数据结构之上,通过在测试系统上刷各种算法题,体会利用数据结构改进优化算法。该阶段学习利器:刷题,总结,刷题。
刷题网站
打比赛:HDU、POJ、Vjudge、Code Forces
找工作:LeetCode
05
算法为什么那么难
很多人感叹:算法为什么 那么难!首先,算法本身具有一定的复杂性,还有一个原因:讲的太烂!算法的教与学有两个困难:
▲ 我们学习了那些经典的算法,在惊叹它们奇思妙想的同时,难免疑虑重重:这么牛,怎么想到的?对学生来说,这可能是最费解、也最让人窝火的地方。高手讲,学算法要学它的来龙去脉,包括种种证明。
但这对菜鸟来说,简直比登天还难,很可能花费很多时间也无法搞清楚。这条路对大多数人来说,是行不通的,那怎么办呢?下功夫去记忆书上的算法?记住这些算法的效率?看似学会了,其实两手空空。遇到一个新问题,仍然无从下手。
可这偏偏又是极重要的,无论作研究还是实际工作,一个计算机专业人士最重要的能力,就是解决问题——解决那些不断从实际应用中冒出来的新问题。
▲ 算法作为一门学问,有两条几乎平行的线索。一个是数据结构(数据对象):数、矩阵、集合、串、排列、图、表达式、分布等等。另一个是算法策略:贪心、分治、动态规划、线性规划、搜索等等。
这两条线索是相互独立的:同一个数据对象上有不同的问题,例如单源最短路径和最优二叉树,就可以用到不同的算法策略,如贪心和动态规划;而同一个算法策略,例如排序和整数乘法,也会用到不同的数据结构。它们之间是多对多的关系。
两条线索交织在一起,该如何表述?
我们早已习惯《数据结构》中讲数据结构,《算法设计与分析》里面讲算法策略。各说各的,讲算法设计时就假设你已经对数据结构了如指掌,还没有哪一本算法书很好的解决这两个困难,传统的算法书,大多注重内容的收录,但却忽视思维过程的展示,因此我们学习了经典的算法,却费解于算法设计的过程。
遇到一个实际问题,通过问题分析,选择使用什么样的算法策略,基于这种算法策略选择什么样的数据结构,有时算法策略和数据结构的选择并不是唯一的,不同的算法策略和数据结构设计的算法,其复杂性是不同的。
而很多书就是灌输式的讲一个实例,一下子就选择了一个认定是最优的算法策略,告诉你就这样干,不谈数据结构,然后分析算法复杂性,就结束了。
原则上讲算法策略就讲算法策略,不依赖任何程序设计语言和数据结构,但对很多学生来讲,尤其是语言没学好,数据结构也不熟练的同学,只讲算法策略,如同空中楼阁。自己用算法解决实际问题,一头雾水。
《趣学算法》,从问题出发,根据实际问题进行分析,选择合适的算法策略,并分析为什么采用这种算法策略,然后选择什么数据结构,不同的数据结构复杂性会有什么区别,巧妙地将数据结构和算法策略拧成了一条线。
通过大量实例,充分展现算法设计的思维过程,让学生充分体会遇到一个问题,如何分析,使用什么算法策略,采用什么数据结构,算法的复杂性如何?是否有优化的可能?
西方教育旨在激发学生对世界的好奇心,而在这里,我们培养的是让学生怀着一颗好奇心,思考问题、解决问题的能力。更重要的是——体会学习的乐趣,发现算法的美!
06
算法学习秘籍
知识在于积累,学习需要耐力。学习就像挖金矿,或许一开始毫无头绪,一头雾水,但转个角度,换换工具,时间久了总会找到一个缝隙。成功就是你比别人多走了一段路,或许恰恰是那么一小步。
▲ 第一个建议:多角度,对比学习
学习算法,可以先阅读一本简单的入门书,然后综合几本书横向多角度看,例如学习动态规划,拿几本算法书,把动态规划这章找出来,比较学习,多角度对比分析更清晰,或许你会恍然大悟,噢,原来如此简单。
或许有同学说我哪有那么多钱买那么多书,只要你想学习,没有什么可以阻挡!你可以图书馆借,也可以联系你的老师,每学期上课前,我都会告诉学生,如果你想学习却没钱买书,我可以提供帮助。想一想,你真的没有办法?
▲ 第二个建议:大视野,不求甚解
经常有学生为了一个公式推导,或几句代码抛锚,甚至停滞数日,然后淹没在无尽的挫败感中,把自己弄得垂头丧气。公式可以不懂,代码可以不会。你不必投入大量精力试图推导书上的每一个公式,也不必探究语法或技术细节。
学算法就是学算法本身,首先是算法思想,解题思路,然后是算法实现,算法思想的背后可能有高深的数学模型,复杂的公式推导,你理解了当然玄妙,不懂就拉倒。
算法实现可以用任何语言,所以不必纠结是 C,C++,Java,Python,更不必管严格的语法规则,除非你要上机调试。
建议还是先领会算法,写伪代码,在大脑中调试吧,如果没有良好的编程经验,一开始就上机或许更让你崩溃。遇到不懂的部分,浏览一下或跳过去,读完了还不明白再翻翻别的书,
总有一天,你会发现,“暮然回首,那人却在灯火阑珊处”。
▲ 第三个建议:多交流,见贤思齐
与同学,朋友,教师或其他编程爱好者们一起学习和讨论问题,是取得进步最有效的办法,也是分享知识和快乐的途径。
加入论坛,加入交流群,会了解其它人在做什么,怎么做,遇到问题可以请教高手,带来醍醐灌顶的喜悦;也可以应助菜鸟,使你暗自得意,信心倍增。论坛和群也会分享大量的学习资料和视频,还有不定期的培训讲座,读书交流会,你会发现,不是你一个人在战斗!
▲ 第四个建议:勤实战,越挫越勇
实践是检验一切真理的标准。古人云:“学以致用”,“师夷长技以制夷”。请不要急切期盼“实际的”例子,更不要看不起小实例,“不积跬步,无以至千里”。
大规模的成功商业案例所采用的算法,人工情感,无人驾驶,不是我们目前要解决的问题。
看清楚脚下的路,比仰望天空更实际,多做一些实战练习,更好地体会算法的本质,在错误中不断成长,越挫越勇,终究会成参天大树。
▲ 第五个建议:看电影,洞察未来
不管是讲《人工智能》,还是《算法分析》,我都会建议同学们去看一看科幻电影,如《人工智能》、《记忆裂痕》、《绝密飞行》、《未来战士》、《她》等等。奇妙的是,这些科幻的东西,正在一步步的实现,靠的是什么?
人工智能。计算机的终极是人工智能,人工智能的核心是算法。未来的战争是科技的战争,先进的科技需要人工智能。我们的国家还有很多技术落后,未来需要你。
“一心两本”学习法:
一颗好奇心,两个记录本。怀着一颗好奇心去学习,才能不断的解决问题,获得满足感,体会算法的美。
很多科学大牛的秘诀就是永远保持一颗好奇心;一个记录本用来记录学习重点难点,随时的突发奇想;一个记录本做日记或周记,记录一天或一周来学了什么,有什么经验教训,需要注意什么,计划下一天或下一周做什么。
不停的总结反思过去,计划未来,这样每天都有事做,心中满满的能量。一个人经常上课睡觉,因为他心中无事可做;一个人经常失眠,因为他心里事儿太多!
07
如何打开数据结构和算法这两扇门
推荐给大家的两本入门书 :
《趣学数据结构》和《趣学算法》。
《趣学数据结构》
作者: 陈小玉
广告
作者:陈小玉
京东
推荐这本书的三大理由:
▲ 完美图解+ 丰富实例,复杂问题简单化
为基本操作配以图解,用数据结构解决生活中的实际问题,学习过程更加轻松有趣。
▲ 原理分析+ 实战演练,真正地学以致用
通俗化讲解基础知识,在实战中体会数据结构的设计和操作,锻炼独立思考的能力。
▲ 配套代码+ 在线答疑,为学习保驾护航
提供书中的范例程序源代码、练习题以及答案解析,并在博客和 QQ 群中答疑解惑。
▲ 内容简介
本书基于 C++语言编写,从趣味故事引入算法复杂性计算及数据结构基础内容,涵盖线性结构、树形结构和图形结构,包括链表、栈和队列、树和图的应用等。本书内容还涉及数据结构的基本应用(包括各种查找、排序等)和高级应用(包括优先队列、并查集、B-树、B+树和红黑树等)。
通过大量图解将抽象数据模型简单通俗化,语言表述浅显易懂,并结合有趣的实例帮助读者轻松掌握数据结构。
▲ 适读人群
本书可作为程序员的学习用书,也适合没有太多编程经验但又对数据结构有强烈兴趣的初学者使用,同时也可作为高等院校计算机、数学及相关专业的师生用书,或学科竞赛的辅导用书和培训学校的教材。
《趣学算法》
作者: 陈小玉
广告
作者:陈小玉
京东
选择这本书的六大理由:
▲ 实例丰富,通俗易懂。从有趣的故事引入算法,从简单到复杂,使读者从实例中体会算法设计思想。实例讲解通俗易懂,让读者获得最大程度的启发,锻炼分析问题和解决问题的能力。
▲ 完美图解,简单有趣。结合大量完美绘图,对算法进行分解剖析,使复杂难懂的问题变得简单有趣,给读者带来巨大的阅读乐趣,使读者在阅读中不知不觉地学到算法知识,体会算法的本质。
▲ 深入浅出,透析本质。采用伪代码描述算法,既简洁易懂,又能抓住本质,算法思想描述及注释使代码更加通俗易懂。对算法设计初衷和算法复杂性的分析全面细致,既有逐步得出结论的推导过程,又有直观的绘图展示。
▲ 实战演练,循序渐进。每一个算法讲解清楚后,进行实战演练,使读者在实战中体会算法,增强自信,从而提高读者独立思考和动手实践的能力。丰富的练习题和思考题用于及时检验读者对所学知识掌的握情况,为读者从小问题出发到逐步解决大型复杂性问题奠定了基础。
▲ 算法解析,优化拓展。每一个实例都进行了详细的算法解析,分析算法的时间复杂度和空间复杂度,并对其优化拓展进一步讨论,提出了改进算法,并进行伪码讲解和实战演练,最后分析优化算法的复杂度进行对比。使读者在学习算法的基础上更上一个阶梯,对算法优化有更清晰的认识。
▲ 网络资源,技术支持。网络提供本书所有范例程序的源代码、练习题以及答案解析,这些源代码可以自由修改编译,以符合读者的需要。本书提供源代码执行、调试说明书,对读者存在的问题提供技术支持。
你眼中算法的“难”,
很有可能是你没找到正确的方法!
在陈小玉老师的学习秘籍下,
算法so easy!
认真阅读《趣学算法》,
相信你能够笑傲面试场!