爬取简书全站文章并生成 API(四)

677 查看


简书

通过前面的介绍,可以说这个小项目已经基本完成了,当然,后面还要做的就是代码重构,功能的不断完善以及 bug 修复。最后就是部署上线了,第一节已经提到过部署上线将会有两种方式,本节先介绍第一种方式,使用 nginx + uwsgi + django + supervisor 进行环境部署。

nginx + uwsgi + django + supervisor 进行环境部署

使用 Django 有一段时间了,但是一直都是在本地测试使用,还没有真实部署过。本来想着按别人博客的教程,部署起来应该很简单,但是在百度和 google 看了十多篇教程依然没有部署成功,我实在很失望,最后在别人的帮助下才部署完成的,所以将部署过程下来,包括部署过程遇到的许多坑。在安装前,先为大家介绍下基本知识。

  • nginx 是一个 web 服务器,这个大家多少都了解,常用做反向代理,只能处理静态内容,动态内容需要转发给对应的服务器进行处理。

  • Django 是一个 wsgi 应用程序,需要 wsgi 服务器来运行,就像 java 需要用 tomcat 服务器一样,正常情况下只需要将 web 项目部署在应用服务器软件上就可以对外提供服务。

  • uWSGI 包含两个协议 WSGI & uwsgi,它同样也是一个应用服务器。WSGIweb 服务器(nginx)和应用服务器通讯用的,uwsgi 同样也是一个通讯协议,是一个 uWSGI 服务器自有的协议,你首先需要一个 uWSGI 服务器来用 uWSGI 协议来使用你的 WSGI 应用。uwsgi 是最流行的 uWSGI 服务器。

以下安装环境是 CentOS7 x86_64 + python2.7.10 + Django 1.9, CentOS 6 同样适用。

1. 安装

首先环境的安装,除了 nginx,另外两个都可以通过pip安装:

# pip install django
# pip install uwsgi

nginx 可以直接使用 yum 安装,编译安装请参考 编译安装 nginx

# yum install nginx -y

创建一个 Django 应用,由于使用 nginx ,应用程序最好放置在 nginx 根目录下:

# django-admin startproject jianshu_api
# cd jianshu_api/    
# django-admin startapp jianshu

然后在配置文件 settings.py 中设置所要连接的数据库,将 DEBUG = True 改为 DEBUG = False,设置 ALLOWED_HOSTS = ['*'] ,并在最后面添加如下配置:

STATIC_ROOT = os.path.join(BASE_DIR, 'static')

然后运行,自动生成 static 目录:

# python manage.py collectstatic

或者直接复制静态文件到对应的目录下:

# cp -r /root/.pyenv/versions/2.7.10/lib/python2.7/site-packages/rest_framework /usr/html/jianshu/static/

# cp -r /root/.pyenv/versions/2.7.10/lib/python2.7/site-packages/django/contrib/admin/static/*  /usr/html/jianshu/static/

如果没有设置正确,则访问网站时,对应的静态文件无法加载,就像下面这样:


无法加载静态文件

2. 配置服务

首先配置 nginx:

server {
      listen 8080;
      #server_name  jianshuapi ;  
      access_log  /var/log/nginx/api.log;

      # app 根目录
      root   /usr/html/jianshu;
      index index.py index.htm;
      location / {
          # nginx 收到请求会就转发到 9001 端口
          uwsgi_pass 127.0.0.1:9001;
          include /etc/nginx/uwsgi_params;
      }
     #设定静态文件所在目录
    location ^~ /static {
        alias /usr/html/jianshu/static;

    }
}

检查语法并重启:

# nginx -t
# nginx -s reload

配置 uWSGi:

先创建 uWSGI 运行的配置文件 jianshu.ini

# mkdir -p /etc/uwsgi && cd /etc/uwsgi

[uwsgi]
chdir = /usr/html/jianshu  
socket = 127.0.0.1:9001
master = true
uid = root
wsgi-file = /usr/html/jianshu/jianshu_api/wsgi.py  

processes = 2
threads = 4

chmod-socket = 666
chown-socket = root:nginx

vacuum = true

测试 uWSGi 是否能正常运行:

# uwsgi /etc/uwsgi/jianshu.ini

然后在命令行中进行访问 http://222.24.63.118:8080/ :


api 测试

现在可以看到已经部署成功了。但是通常情况下我们都使用 supervisor 来管理
uwsginginx ,这样操作起来更方便。

3. 使用 supervisor

supervisor 的详细用法请参考: 使用 supervisor 管理进程

首先安装 supervisor

# pip install supervisor

然后生成配置文件:

# echo_supervisord_conf > /etc/supervisord.conf

启动 supervisord

# supervisord

提供 uwsgi 的配置文件,打开 /etc/supervisord.conf 在最底部添加:

[program:jianshu]  ; 添加 uwsgi 的配置示例
command=/root/.pyenv/shims/uwsgi --ini /etc/uwsgi/jianshu.ini 
directory=/usr/html/jianshu/
stdout_logfile=/var/log/supervisor/%(program_name)s_access.log 
stderr_logfile=/var/log/supervisor/%(program_name)s_err.log
startsecs=10
stopwaitsecs=0
autostart=true 
autorestart=true

[program:nginx]      ;nginx 配置示例
directory=/  
command=/usr/sbin/nginx -c /etc/nginx/nginx.conf
user=root
stdout_logfile=/var/log/supervisor/%(program_name)s_access.log 
stderr_logfile=/var/log/supervisor/%(program_name)s_err.log
autostart=true 
autorestart=true 
startsecs=10

然后重新载入 supervisor 的配置:

# supervisorctl reload

查看 supervisor 的状态:

# supervisorctl status 
jianshu                          RUNNING   pid 19466, uptime 0:07:08
nginx                             RUNNING   pid 19490, uptime 0:07:05

再次访问 api 界面 http://222.24.63.118:8080/。


简书 API

-_- 总算部署完成,好开心啊,欢迎大家使用 API,但是别乱用,毕竟服务器资源有限!
-_- 下一节将会为大家介绍如何用 docker 部署。