掌握Node.js：实战编写一个爬虫程序

发表时间: 2018-02-07 15:20

这个Node.js爬虫是我之前写过的一个简单的小爬虫，我之前写的文章都是Python的爬虫，先来看看Node.js和Python的比较

Node.js优于Python的地方

快：这个快有两方面，第一是V8引擎快，在V8引擎背后操刀的是Lars Bak大神，他创造过高性能SmallTalk引擎和Java Hotspot引擎(现在Java的默认VM)，他带领下的V8引擎让Javascript速度达到了一个新的阶段。第二是异步执行，Node.js功能上是一个基于V8引擎的异步网络和IO Library，和Python的Twisted很像，不同的是Node.js的event loop是很底层的深入在语言中的，可以想象成整个文件在执行的时候就在一个很大的event loop里。
npm：npm可以说是用起来最顺手的package management了，npm作为Node.js的官方package management，汇集了整个社区最集中的资源。不像Python经历过easy_install和pip，还有2to3的问题。
Windows支持：Node.js有微软的加持，Windows基本被视为一等公民来支持，libuv已经可以很好的做到统一跨平台的API；而Python虽然也对Windows有官方的支持，但是总感觉是二等公民，时不时出些问题。

Python优于Node.js的地方

语言：就单纯从语言的角度来说，Python写起来要比Javascript舒服很多。Javascript设计本身有许多缺陷，毕竟当时设计的时候只是作为在浏览器中做一些简单任务的script，所以代码一旦庞大，维护还是有困难（不过Node.js的module很大的改善了这个问题）。不过用Coffeescript可以很大的改善Javascript，几乎可以和Python等同。
成熟：成熟包括语言本身已经成熟，还有Framework和ecosystem也很庞大。Node.js的绝大多数framework都很新，有的API一直在变，有的感觉已经不在维护，总之没有一个像Django那种百足之虫感觉的framework。