爬虫和普通调接口的区别是:网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本;接口(硬件类接口)是指同一计算机不同功能层之间的通信规则称为接口。
一、爬虫和普通调接口的区别
爬虫
网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。
通俗来讲,假如你需要互联网上的信息,如商品价格,图片视频资源等,但你又不想或者不能自己一个一个自己去打开网页收集,这时候你便写了一个程序,让程序按照你指定好的规则去互联网上收集信息,这便是爬虫,我们熟知的百度,谷歌等搜索引擎背后其实也是一个巨大的爬虫。
普通接口
接口(硬件类接口)是指同一计算机不同功能层之间的通信规则称为接口。接口(软件类接口)是指对协定进行定义的引用类型。其他类型实现接口,以保证它们支持某些操作。接口指定必须由类提供的成员或实现它的其他接口。与类相似,接口可以包含方法、属性、索引器和事件作为成员。
Java里面由于不允许多重继承,所以如果要实现多个类的功能,则可以通过实现多个接口来实现。
Java接口和Java抽象类代表的就是抽象类型,就是我们需要提出的抽象层的具体表现。OOP面向对象的编程,如果要提高程序的复用率,增加程序的可维护性,可扩展性,就必须是面向接口的编程,面向抽象的编程,正确地使用接口、抽象类这些太有用的抽象类型做为java结构层次上的顶层。
延伸阅读:
二、为什么爬虫用python
很多人提到爬虫就会想到Python,其实除了Python,其他的语言诸如C,PHP,Java等等都可以写爬虫,而且一般来说这些语言的执行效率还要比Python要高,但为什么目前来说,Python渐渐成为了写很多人写爬虫的名列前茅选择,我简单总结了以下几点:
开发效率高,代码简洁,一行代码就可完成请求,100行可以完成一个复杂的爬虫任务;
爬虫对于代码执行效率要求不高,网站IO才是最影响爬虫效率的。如一个网页请求可能需要100ms,数据处理10ms还是1ms影响不大;
非常多优异的第三方库,如requests,beautifulsoup,selenium等等;
本文后续内容也将会以Python作为基础来进行讲解。
以上就是关于爬虫和普通调接口有什么区别的内容希望对大家有帮助。