用 Python 拓展 GDB(四)

345 查看

欢迎来到《用python拓展gdb》的最后一篇。第一篇结尾,我提到了通用语言相对于领域特定语言的一项优势,即在处理数据上更加灵活。其实通用语言还有着另一样优势,领域特定语言只能局限在宿主程序中使用,而通用语言则无此限制。对于通用语言来说,gdb暴露的接口不过是又一个库而已。

在本篇中,我们会把python当作一门“胶水语言”,A面是gdb的接口,B面是一个终端界面的程序。姑且把这个终端界面程序称之为gti(gdb's terminal interface)吧。我们会实现从gdb到gti的单向数据传输。每当gdb触发断点时,就在gti上自动输出各项相关信息。这两者间的通讯使用UDP协议。换言之,接下来要完成的是一个位于gdb内部UDP客户端,和监听指定端口的带终端界面的UDP服务端。

gdb 端实现

gdb端功能如下:

  1. 每当断点被触发时,通过gdb接口获取info breakpointsinfo args,以及info locals三者的值

  2. 把上述三者的值转换成json格式

  3. 通过UDP协议发送到端口9876

功能要求看上去很多,不过实现成代码其实也就二三十行:

import json
import socket
import gdb


HOST = 'localhost'
PORT = 9876
SOCK = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
SOCK.connect((HOST, PORT))

def send_data(event):
    cur = event.breakpoints[0].location
    if cur is None:
        cur = event.breakpoints[0].expr
    local_vars = gdb.execute('info locals', to_string=True)
    args = gdb.execute('info args', to_string=True)
    bps = gdb.execute('info breakpoints', to_string=True)
    data = {
        'current': cur,
        'locals': local_vars,
        'args': args,
        'breakpoints': bps
    }
    data = json.dumps(data)
    SOCK.send(bytes(data, 'utf-8'))


gdb.events.stop.connect(send_data)

在此之前,需要设置一个监听9876端口的服务端,不然客户端这边就建立不了连接。运行nc -l 9876作为服务端的mock,暂时只需观察下发送过来的数据是否正确。

写一个自动化脚本,让gdb设置若干断点并运行,连续执行多次continue。你应该可以观察到接连有数据显示在nc的输出中:

$ nc -l 9876
{"locals": "pointers = ...

gti 端实现

gti 端功能如下:

  1. 监听端口9876

  2. 每当收到数据包时,提取出json格式的数据

  3. 根据收到的数据,重绘当前界面

在绘制终端界面时,我用的是自带的curses模块。在监听端口方面,我用的是python3.4之后才有的async模块。当然萝卜白菜,各有所爱,大可改用你自己喜欢的库。

#!/usr/bin/env python3
import asyncio
import curses
import json

def main():
    loop = asyncio.get_event_loop()
    # 1. 监听端口9876
    server = loop.create_datagram_endpoint(
        GtiProtocol, local_addr=('127.0.0.1', 9876))
    try:
        loop.run_until_complete(server)
        loop.run_forever()
    except KeyboardInterrupt:
        pass
    finally:
        curses.endwin()


class GtiProtocol(asyncio.Protocol):
    def __init__(self):
        self.ui = TextPad()

    def datagram_received(self, byte, _):
        "2. 将收到的数据从byte转成json"
        data = byte.decode()
        data = json.loads(data)
        self.ui.display(data)


class TextPad:
    def __init__(self):
        self.pad = curses.initscr()
        curses.start_color()

    def _addstr(self, text):
        self.pad.addstr(text, curses.A_BOLD)

    def display(self, data):
        "3. 根据给定的数据重绘界面"
        try:
            self.pad.erase()
            self._addstr('current: %s\n\n' % data['current'])
            for key, value in data.items():
                if key != 'current':
                    self._addstr('%s:\n' % key)
                    self._addstr(value)
                    self._addstr('\n')
            self.pad.refresh()
        except curses.error:
            pass


main()

现在可以用./gti.py来替换掉nc -l 9876,再重新运行gdb。你应该能看到,每当有新的断点触发时,./gti.py就会应用新的数据绘制界面。

顺便一提,使用curses模块纯粹是为了方便示范。curses提供的接口过于底层,许多细节方面都需要自己去抠。如果真的要开发实际可用的终端界面程序,建议使用诸如urwid这样的第三方包。

小结

如上面的例子所示,我们成功地用python实现了内嵌于gdb的客户端。该客户端可以向外界暴露出gdb调试时的信息。依据同样的思路,我们也可以在gdb内实现内嵌的服务端,这样外界就能动态修改gdb调试的方式。当然,这一切离不开python这把“瑞士军刀”。

《用python拓展gdb》系列到此就结束了。如果你正准备编写一个拓展,希望本教程可以教会相关的知识。如果你是一位C/C++开发者,希望本教程能够让你的工具箱增添新道具。如果你是想了解更多关于gdb调试的信息,希望今后遇到相关问题时能想起编写python拓展予以解决。