C++高效解析JSON字符串
1. 什么是JSON字符串说明?
定义:
JSON(Javascript Object Notation)是一种轻量级的数据交换格式,易于阅读和编写,也易于机器解析和生成。
结构:
a. 名称/值 的集合,Json对象是键值对构成,类似于map。其键为普通字符串,值可以为任意类型,如数字、逻辑值、文本、数组对象、Json对象、null等。
b. 数组,Json对象也可以为一个数组,有一个或者多个数值构成,其中数值可以为任意类型,如数字、逻辑值、文本、数组对象、Json对象、null等。
c. 语法
数据在名称/值对中
数据由逗号分隔
花括号保存对象
方括号保存数组
举例:
a. 简单例子:{"firstname": "peisheng"}
b. 多个数据:{"firstname": "peisheng", "lastname": "h", "email": "buzhidao"}
c. 数组例子:
{ "zubie": "cad",
"members": [
{"firstname": "peisheng", "lastname": "h", "email": "buzhidao"},
{"firstname": "peisheng", "lastname": "h", "email": "buzhidao"},
{"firstname": "peisheng", "lastname": "h", "email": "buzhidao"}
]
}
2. 为什么选择Json作为数据传输?而不是XML?
可读性:Json和XML相比可谓不相上下,一边是简单的语法,一边是规范的标签形式,很难分出胜负。
可扩展性:XML天生有很好的可扩展性,Json也有。
编码难度:XML有丰富的编码工具,Json也有提供,但是XML要输入很多结构字符。
解码难度:凡是可扩展的数据结构,解析起来都很困难。
数据量: Json具有轻小的特点,降低了数据传输量。
3. JSONCPP库介绍
目前市场上有很多Json解析的开源库,http://www.json.org/,这个网站中有对Json的介绍,以及列出了各种语言实现的Json解析库。JSONCPP是一个C++实现的面向对象的跨平台开源库,具有易用、易读的特点。
JSONCPP中重要的类:
a. Json::Value 可以表示所有的类型,比如int、string、object、array等。
b. Json::Reader 可以从Json字符串中解析出Json::Value对象。
c. Json::Writer 可以把Json::Value对象写入到字符串流或者文件中。
但是JsonCPP解析性能低,使用了std标准库的东西,在CAD的环境下很容易崩溃,最后放弃。
4. 如何读取Json字符串?
解码时,把Json字符串看成是一个map对象(object),对象(object)的键为字符串,值为任意类型,可以为int、string、bool、array、object等。解析Json字符串时,首先对当前层map解析解析,解析出key/val对。
解析过程:
a. 在键值对出现时,记录键的起始位置,kvoff1_key, kvoff1_val
b. 在键值对结束时,记录值的结束位置,kvoff2_key, kvoff2_val
c. 设置*kvoff2_key = 0, *kvoff2_val = 2
d. 在Json对象中,用map记录键值的起始位置
e. 重复a~d四个步骤
举例说明:
{"k1":"x1","k2":[1,2,3],"k3":{"k31":"v1"}}
按照上面的步骤进行解析
a. kvoff1_key=2, kvoff1_val=7
b. kvoff2_key=4, kv0ff2_val=9
c. *kvoff2_key=0, *kvoff2_val=0
d. Map.insert(kvoff1_key, kvoff1_val)
e. 重复a~d
5. 如何编辑Json字符串?
由于Json对象在内部维护了一份Json字符串内存RawBuf,插入时,在RawBuf后面添加一份键值对,并在所属的Json对象中记录一下键值对的起始位置,设置键和值的末尾值为0。
如果追加的字符串的大小,比RawBuf剩余空间大时,添加List<TCHAR*> RawBufs字段,提供多缓冲支持,最后一个Buffer为当前正在使用的Buffer。
RawBuf是使用步骤:
a. 初始化Json对象时,初始化一个 RAWBUFLEN=65535的TCHAR数组,并将该数组的指针添加到RawBufs中。
b. 插入一个键值对时,如果Buffer的剩余空间不足,生成一个大小为max(RAWBUFLEN, len(key) + len(val) + 2) 大小的TCHAR数组,并将数组的指针添加到RawBufs中,在将新值复制到刚才申请的空间里。