framing
成帧(framing):解决接收端如何定位消息的首尾位置的问题。
无论信息是编码成文本、多字节二进制数、或是两者结合,应用程序协议必须制定消息的接收者如何确定何时消息已完整接收。
如果是采用DatagramPacket发送,则没有问题,因为它有一个确定的长度告诉接收者,让其知道消息的结束位置。
如果是通过TCP传送,则比较复杂,因为TCP协议中没有边界的概念。
变长消息
如果一个消息中的所有字段都有固定的长度,同时每个消息又是由固定数量的字段组成的话,消息的长度就能够确定,接收者就可以简单地讲消息长度对应的字节数读到一个byte[]缓存区中。
如果消息的长度是可变的,则我们无法事先知道需要读取多少字节。
如果接收者试图从套接字中读取比消息本身更多的字节,将可能发生以下两种情况之一:
1)如果信道中没有其他消息,接收者将阻塞等待,同时无法处理接收到的消息,如果发送者也在等待接收端的响应信息,则会造成死锁
2)如果信道中还有其他消息,则接收者会将后面消息的一部分甚至全部读到第一条消息中去,这将产生一些协议错误。
消息结束标识
主要有两个技术使接收者能够准确地找到消息的结束位置:
1)基于定界符(Delimiter-based)
消息的结束由一个唯一的标记指出,即发送者在传输完数据后显式添加的一个特殊字符序列。这个特殊标记不能在传输的数据中出现。特殊情况是,可以用在TCP连接上传输的最后一个消息上,发送完这个消息后,发送者就简单地关闭发送端的TCP连接,接收者读取完这条消息的最后一个字节后,将接收到熬一个流结束标记,即read返回-1,该标记指出已经读取到达了消息的末尾。
通常用在以文本方式编码的消息中,定义一个特殊的字符或字符串来标识消息的结束。
public byte[] nextMsg() throws IOException {
ByteArrayOutputStream messageBuffer = new ByteArrayOutputStream();
int nextByte;
// fetch bytes until find delimiter
while ((nextByte = in.read()) != DELIMITER) {
if (nextByte == -1) { // end of stream?
if (messageBuffer.size() == 0) { // if no byte read
return null;
} else { // if bytes followed by end of stream: framing error
throw new EOFException("Non-empty message without delimiter");
}
}
messageBuffer.write(nextByte); // write byte to buffer
}
return messageBuffer.toByteArray();
}
2)显示长度(Explicit length)
在变长字段或消息前附加一个固定大小的字段,用来指定字段或消息中包含了多少字节。发送者先要确定消息的长度,将长度信息写入一个整数,作为消息的前缀。消息的长度上限定义了用来编码消息长度所需要的字节数,如果消息的长度小于256字节,则需要1个字节,如果消息的长度小于65536字节,则需要2个字节。
public byte[] nextMsg() throws IOException {
int length;
try {
length = in.readUnsignedShort(); // read 2 bytes
} catch (EOFException e) { // no (or 1 byte) message
return null;
}
// 0 <= length <= 65535
byte[] msg = new byte[length];
in.readFully(msg); // if exception, it's a framing error.
return msg;
}
readFully方法将阻塞等待,直到给定的数组完全填满。