玩数据的时候,免不了与json接触。这两天在玩漫威的API,采集数据和存储数据时,因为我没有MongoDB数据库,免不了要将Json(dict)数据格式保存,再将其转换成python的各种数据格式:dataframe或dict等。在此记录几个场景,和解决办法:
Json单条举例:多dict嵌套,模拟实际接触到的数据类型
1 | dct = {'aaa': 'bbb', 'ccc': {'ff': 'gg', 'dd': 'ee', 'hh': {'i': 'j'}}} |
CASE 1:逐条获得dict数据时,(逐条)写进data1.json
1 | # 对 Marvel API请求数据时,是逐条获取dict的,此处‘dct’表示逐条获取的内容 |
CASE 2:(逐条)读取data1.json里的内容
1 | # data1.json 里的逐条内容都是以 str 形式存储的 |
这里我尝试了各种 json.load, pd.read_json都没有成功,最后用ast一步解决。
CASE 3:逐条获得dict数据时,(逐条)对dict进行变换再写进data2.json
1 | # 有时需要对获取的dict数据再作处理再保存 |
CASE 4:对data2.json的json文件进行内容读取
1 | # 此时用ast却报错了,因此换 yaml |