揭秘后端开发的神秘面纱:从入门到精通

发表时间: 2024-06-09 10:10

当我刚开始从事 Web 开发时,没有前端或后端之类的东西。

原因很简单,当时服务器端代码就是一切:接受浏览器请求、实现业务逻辑、访问数据库、用 JSP 生成 HTML,然后发送给浏览器。

即使后来Javascript在浏览器端增加了一些AJAX效果,那也只是锦上添花而已,没人敢贸然行事,因为页面的HTML主要还是采用所谓“模板集”的方式生成的:美工生成HTML模板,程序员利用JSP、Velocity、FreeMaker等技术添加动态内容,仅此而已。

当时最流行的图片是这样的:

在最初的J2EE体系中,表现层不仅仅是运行在浏览器中的页面,还包括用Java编写的桌面,但是Java在桌面上竞争力不够,没有发展起来。

每个程序员都是所谓的“全栈”工程师,不仅要掌握 HTML、JavaScript 和 CSS,还要实现业务逻辑、编写代码来访问数据库。到了部署的时候,把所有代码打包成 WAR 包,扔到 Tomcat 指定的目录中,测试一下有没有问题,然后就收工了!

不缺钱的公司会把程序部署到WebLogic、Websphere等应用服务器上,也会使用高级的EJB。

生活虽然看上去“简单”“舒服”,但其实需要满足那些多变、不合逻辑的业务要求,艰辛的本质并没有改变。

1.前后端分离

随着人们对浏览器页面的可视化、交互功能的要求越来越高,“基于模板”的方式渐渐不能满足要求,所谓的展现层也慢慢迁移到了浏览器端,并且出现了大量的Angular、ReactJS等框架,将前后端割裂开来!

后端工程师只负责提供接口和数据,专注于业务逻辑的实现,前端获取数据并展示在浏览器上,各司其职。

像Java这样的语言非常适合实现复杂的业务逻辑,特别是一些MIS系统,税务、电力、烟草、金融、通信等行业软件,所以剥掉表现层,只做后端是比较合适的。

但如果只是为了实现业务逻辑的话,后端就不需要那么多技术了,搞定SSH/SSM就行了。

2.后端技术

互联网特别是移动互联网兴起之后,海量的用户涌入,一个小小的War包部署在单机上肯定支撑不住,必须要分布式。

原来单机的Tomcat要变成Tomcat集群,前面加一个Web服务器做请求负载均衡,不仅如此,还得考虑状态问题和会话一致性。

(注:参见文章《新手科普:分布式和集群》)

随着业务越来越复杂,我们不得不把一些业务放在一台机器(或集群),其他业务放在另一台机器(或集群)。虽然系统的计算和处理能力已经大大增强,但是这些系统之间的通信却成了一个令人头疼的问题。消息队列(MQ)、RPC框架(如Dubbo)应运而生。为了提高通信效率,各种序列化工具(如Protobuf)也相继问世。

如果单个数据库已经无法支撑工作负载,那么我们需要将数据库的读写操作分开。如果这仍然不起作用,那么我们需要将数据库拆分成单独的表,并将原始数据库垂直或水平切分。然而,无论我们如何切分,都会使应用程序访问变得非常麻烦,因为数据需要跨数据库进行连接/排序,并且需要事务。为了解决这个问题,已经创建了各种“数据访问中间件”工具和产品。

为了最大化性能,缓存肯定是不可缺少的。你可以本地做缓存(比如Ehcache),也可以分布式缓存(比如Redis)。如何做数据分片、数据迁移、故障转移又是另一个超级大话题。

互联网用户喜欢上传图片、文件,因此需要一个要求高可用、高可靠的分布式文件系统(例如FastDFS)。

随着数据量的增加,自然就会出现搜索的需求,需要创建一个支持全文索引的搜索引擎(如Elasticsearch、Solr)。

森林里有各种各样的鸟,所以我们必须考虑安全性,数据加密/解密,签名,证书,防止SQL注入,XSS/CSRF和其他攻击。

3.“大后端”

上面提到了,这么多系统都是分布的,每次上线,运维同事都说:协调这么多系统,好累啊。

我们要做好持续集成,能够做到自动化部署和测试(其实前端也一样)。后来出现了一个革命性的技术docker,可以保持开发、测试、生产环境一致。系统原来只是把代码部署在环境上(如Ngnix、JVM、Tomcat、MySQL等),现在代码和环境都打包在一起了,运维工作一下子就简化了。

企业自己购买服务器成本高,维护麻烦,很难灵活增长。所以企业可以弄几台虚拟服务器,硬盘、内存可以动态扩容(因为是虚拟的),流量大的时候多用一些,流量小的时候就释放一些,按需分配,很方便。这就是云计算的一个场景。

随着时间的流逝,公司和系统收集的数据越来越多,数据已经堆积成一座大山,难道我们就只能把它丢在那里,浪费硬盘空间吗?

有些人惊讶地发现,嘿,我们可以用这些数据做些事情,比如仔细分析数据,预测用户的购买/阅读/浏览习惯,并向他推荐一些东西。

但数据量太大,用传统方法可能要几天甚至几个月才能出结果,等到出结果时已经太迟了。所以我们必须使用分布式技术,把计算分散到各个电脑上,再把结果汇总到一起。时势造英雄,Hadoop 及其生态系统应运而生。

我以前听说过大前端这个概念,把移动端和 Web 端都归为“前端”。我在这里会创造一个术语“大后端”,将所有发生在服务器端、用户无法直接访问的事情都包括在内。

4.如何学好后端?

现在不管是前端还是后端,技术领域数不胜数,细分的都很严重。所以我觉得真正的全栈工程师根本就不存在,因为一个人的精力是有限的,不可能搞定那么多技术领域。太难了。

我认为,培训机构所说的“全栈”,就是指前端与后端还纠缠在一起,还未彻底分离时的“全栈”工程师。

那么问题来了,后端那么多东西,该怎么去学习呢?

我以前写过一篇文章叫《上天还是下地》,讲的是学习的广度和深度,在这里也适用。

如果你挖的更深,你可以成为某个技术领域的专家,比如搜索专家、安全专家、分布式文件专家等等。无论哪个领域,重点不是学会如何使用某种工具、框架,而是确保你能用自己的知识和技术解决这个领域的顶尖问题。

向广度发展,需要对各个技术领域都了解,能够针对某一类需求选择合适的软件和技术架构,将需求转化成合适的技术组件,并以合适的方式将这些组件连接、部署、运行,这也需要不断学习,不断积累经验。

最后我们以一幅漫画来结束吧!

如果你想在程序员的职业生涯中取得更高的成就,C/C++ 是一门既能强化思维能力,又能打下扎实编程基础的编程语言。如果你想做软件开发,成为核心程序员,那么就应该学习 C/C++。笔者有一个千人 C/C++ 编程群(Q艇索:C 语言编程学习聚集地(无言建立))。如果你觉得自学 C/C++ 有难度,有兴趣学习或者了解 C/C++ 编程的朋友可以进来交流。

C/C++高级工程师学习路线图: