之前做过一个项目(web.airdroid.com的短信模块)是可以在web端的输入框输入短信内容,然后调用手机端的API来发送短信。这时候就需要做到跟手机端的短信app的一样的提示效果,即用户在输入的时候,要提示当前是否会拆分多条短信,还有就是当前这条短信的剩余输入字数。最后上线的部分效果图如下:
在实现之前,这边先科普以下,一条短信会有几个字符可以输入,还有就是什么情况下会需要拆分多条短信??
上世纪80年代无线传输的带宽不高,这就要求手机短信要言简意赅。短信发明人Hillebrand为遵从这一要求,经过试验后将160个字符作为短信长度上限,英文字母可发160个(参考文献)。
因为英文字母采用7位ASCII编码,而汉字则采用8位UCS-2编码并占2个字节,所以160个字符按照7位ASCII编码来换算,即160X7=1120位;而汉字是按照8位的UCS-2编码,即8位一个字符,一个汉字占2个字符,这样1120位换算成汉字数就是1120/8/2=70。如果换算成字节(byte)的话,那么一条短信就是 1120/8 = 140 个字节(一个字节8位(bit))
也就是说,如果是单条短信的话,如果只输入英文字母的话,那么可以输入160个字符,如果输入汉字的话,可以输入70个字符,如果是中英混输的话,就按照汉字来算(只要内容里面有一个汉字,那么整个内容的编码就全部按照汉字的编码来算)。
也就是说,当英文字母超过160个字符之后,这时候短信就会拆分成两条。 如果是汉字超过70个字符之后,也会拆成两条。
这边找到一个站点可以来实践这个东西:传送门
这边具体举几个例子:
如果单纯是英文
可以看到160个,刚好是一条。只要是多出一个字符的话,那么就是分为两条,而且第一条是 153个字符,至于为什么是153个,而不是154个,这个因为如果是多条短信的话,那么前面的6个字节,要用来做头部标识符,因此就只剩下134个字节了,用ASCII编码换算成英文字符的话,就是 (1120 - 6*8) / 7 = 153.14 , 所以就是 153个英文字符了
可以看到,当我英文字符为161的时候,就会分为两条,然后第一条只有153个字符,每一条的前6个字节主要用来做标识符:1
2
3
4
5
6
76位协议头格式:05 00 03 XX MM NN
byte 1 : 05, 表示剩余协议头的长度
byte 2 : 00, 这个值在GSM 03.40规范9.2.3.24.1中规定,表示随后的这批超长短信的标识位长度为1(格式中的XX值)。
byte 3 : 03, 这个值表示剩下短信标识的长度
byte 4 : XX,这批短信的唯一标志(0-255)
byte 5 : MM, 这批短信的数量。如果一个超长短信总共5条,这里的值就是5。
byte 6 : NN, 这批短信的数量。如果当前短信是这批短信中的第一条的值是1,第二条的值是2。如果是中文的话
中文如果刚好是 70 个字的话,那么就刚好一条,如果在多加一个字符的话,就会变成两条了,而且第一条就会变成67个字符了,这个算法跟上面的差不多,(1120 - 6*8) / 8 / 2 = 67 , 所以就是 67 个汉字字符了混合的话,就跟中文一样的处理方式
记住一个原则,如果不是全部都是7bit的ASCII编码,那么就全部按照Unicode (UCS-2) 的编码方式就可以了
原理搞懂了,接下来就是代码了:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68// 改变短信条数和剩余个数, 涉及到 7bit 和 unicode 两种
function ChangeSMSLength (dom, content) {
if (content) {
var charset7bit = ['@', '£', '$', '¥', 'è', 'é', 'ù', 'ì', 'ò', 'Ç', "\n", 'Ø', 'ø', "\r", 'Å', 'å', 'Δ', '_', 'Φ', 'Γ', 'Λ', 'Ω', 'Π', 'Ψ', 'Σ', 'Θ', 'Ξ', 'Æ', 'æ', 'ß', 'É', ' ', '!', '"', '#', '¤', '%', '&', "'", '(', ')', '*', '+', ',', '-', '.', '/', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', ':', ';', '<', '=', '>', '?', '¡', 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'Ä', 'Ö', 'Ñ', 'Ü', '§', '¿', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', 'ä', 'ö', 'ñ', 'ü', 'à'];
var charset7bitext = ["\f", '^', '{', '}', '\\', '[', '~', ']', '|', '€'];
var chars_arr = content.split("");
var coding = '7bit';
// 当前所需要拆分的短信条数
var part = 1;
// 已经使用的总的字符数
var chars_used = 0;
// 一条短信所使用的字符数
var chars_sms = 160;
for (var i = 0; i < chars_arr.length; i++) {
if (charset7bit.indexOf(chars_arr[i]) >= 0) {
chars_used = chars_used + 1;
} else if (charset7bitext.indexOf(chars_arr[i]) >= 0) {
chars_used = chars_used + 2;
} else {
coding = '16bit';
chars_used = chars_arr.length;
break;
}
}
if (coding == '7bit') {
if (chars_used > 160) {
var part_chars_used = 7;
chars_sms = 153;
for (i = 0; i < chars_arr.length; i++) {
if (part_chars_used + 1 > 160) {
part = part + 1;
part_chars_used = 7;
}
if (charset7bitext.indexOf(chars_arr[i]) >= 0 && part_chars_used + 2 > 160) {
part = part + 1;
part_chars_used = 7;
}
if (charset7bitext.indexOf(chars_arr[i]) == -1) {
part_chars_used = part_chars_used + 1;
} else {
part_chars_used = part_chars_used + 2;
}
}
} else {
chars_sms = 160;
}
} else {
if (chars_used > 70) {
var part_chars_used = 3;
chars_sms = 67;
for (i = 0; i < chars_arr.length; i++) {
if (part_chars_used + 1 > 70) {
part = part + 1;
part_chars_used = 3;
}
part_chars_used = part_chars_used + 1;
}
} else {
chars_sms = 70;
}
}
// 当前这一条已经使用的字符数
var chars_single_used = chars_used % chars_sms == 0 ? chars_sms : (chars_used % chars_sms);
dom.html(chars_single_used + "/" + chars_sms + "(" + part + ")");
} else {
dom.html(0);
}
}
调用实例(这边直接拿项目的代码):1
2
3
4var el = chatDom.find(".mod-chat-sendContent[load='1']"),
content = self._editor.getContentValue(el, true); // 输入的内容
ChangeSMSLength(chatDom.find('.mod-chat-chatCount'), content);