写点旧东西,最近一直再看 django
源代码,发现对运行机制还是蛮感兴趣的(太懒了,这块一直没有深入研究过),因为扯到了 wsgi
规范,就想到了原始的 cgi 接口规范
, 这里就先写写我对 cgi 接口规范
的认知,同时也为了下次组内分享预留个开头。
1 远古时代
1991年8月6日,这是个伟大的日子,web 页面首次在因特网上登场,回去早期,web 服务器主要是用来共享静态数据,只是简单的响应浏览器发来的 http
请求,并将存储在服务器上的静态文件返给浏览器。所以早期的 web 服务器的结构如下:
因为早期的用户只有高大上的科学家,这样的架构无可厚非,毕竟只是为了共享自己的一些资料,方便交流。
2 CGI 时代
随着时间的推移,互联网逐渐平民化,技术在进化,网站越来越复杂,远古时代的架构已经不能满足用户的需求。针对用户强烈的动态交互需求,另外一方面,服务器自己并不能运行类似 python
脚本文件,既然服务器没法做,只能联合第三方一起搞,此时与第三方通信还是需要有个约定的,服务器给第三方参数,第三方返回给服务器结果,最后服务器把结果返回给客户端,此后名扬江湖的 CGI(Common Gateway Interface)
诞生了。
CGI
定义了 Web服务器
与外部应用程序之间的通信接口标准,因此 Web服务器
可以通过 CGI
执行外部程序,让外部程序根据Web请求内容生成动态的内容。Perl
因为跨操作系统和易于修改的特性成为 CGI
的主要编写语言。当然,CGI
可以用任何支持标准输入输出和环境变量的语言编写,比如 Shell
脚本, C/C++
语言,只要符合接口标准即可。比如你用C
语言编写 CGI
程序,你把希望返回的 HTML
内容通过 printf
输出就可以发送给Web服务器
,进而返回给用户。
CGI 脚本与服务器通信
服务器与 CGI 脚本通信是通过标准的输入输出和环境变量完成的。
CGI 脚本工作流程
- 浏览器通过HTML表单或超链接请求指向一个
CGI
应用程序的URL
。 - 服务器收发到请求。
- 服务器执行所指定的
CGI
应用程序。 CGI
应用程序执行所需要的操作,通常是基于浏览者输入的内容。CGI
应用程序把结果格式化为网络服务器和浏览器能够理解的文档(通常是HTML网页
)。web 服务器
把结果返回到浏览器中。
CGI 模式性能
CGI
的跨平台性能极佳,几乎可以在任何操作系统上实现。CGI
方式在遇到连接请求(用户请求)先要创建 CGI
的子进程,激活一个 CGI
进程,然后处理请求,处理完后结束这个子进程。这就是 fork-and-execute
模式。所以用 CGI
方式的服务器有多少连接请求就会有多少 CGI
子进程,子进程反复加载是 CGI
性能低下的主要原因。当用户请求数量非常多时,会大量挤占系统的资源如内存,CPU 时间
等,造成效能低下。
3 例子
web 服务器: lighttpd
,脚本语言: python
, 平台: mac
脚本代码
1 2 3 4 5 6 7 8 9 10 |
#!/usr/bin/env python # -*- coding: UTF-8 -*- import os print "Content-Type: text/plain;charset=utf-8\n" print os.environ.get('SERVER_PROTOCOL') print os.environ.get('QUERY_STRING') print "Hello World!" |
浏览器端
输入 url 如下:
1 |
http://127.0.0.1:8080/cgi-bin/test.py?name=kycool&id=0989238423 |
返回结果:
1 2 3 |
HTTP/1.1 name=kycool&id=0989238423 Hello World! |
debug 工具中打开
4 小结
通过例子就会发现,运行模式如下:
例子较为简单,复杂的业务如果写完,估计自己可以造个框架轮子了,因为 CGI
性能低下的原因,python
相关的 wsgi
出现了……
参考文章
https://www.w3.org/CGI/
https://en.wikipedia.org/wiki/Common_Gateway_Interface
http://www.tianmaying.com/blog/8ab3eda84daf4e54014daf68ff09000b