欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python解析Json文件

程序员文章站 2024-02-03 10:28:28
...

Python解析Json文件

写在前面

  在项目开发中,难免会遇到需要解析别人发过来的Json文件或将自己的输出打包成Json发生给别人,(尤其是做算法,50%-70%的工作量都在数据处理,而数据标注文件大多是Json、XML、txt类型),如果你试图直接用记事本或其他编辑器打开Json文件找里面的内容,那恭喜你,你的工作任务将从此刻开始指数级增长,里面密密麻麻都是字符,本文将介绍怎么利用Python解析和打包Json.

一、解析

下面是一个Json文件的内容:

{“path”:“E:\Datasets\YOLO\person\imgs\15.jpg”,“outputs”:{“object”:[{“name”:“face”,“bndbox”:{“xmin”:48,“ymin”:41,“xmax”:74,“ymax”:77}},{“name”:“face”,“bndbox”:{“xmin”:185,“ymin”:16,“xmax”:216,“ymax”:57}},{“name”:“person”,“bndbox”:{“xmin”:15,“ymin”:31,“xmax”:179,“ymax”:366}},{“name”:“person”,“bndbox”:{“xmin”:153,“ymin”:6,“xmax”:298,“ymax”:375}}]},“time_labeled”:1575946134777,“labeled”:true,“size”:{“width”:416,“height”:416,“depth”:3}}

该文件的内容是图片的路径,以及图片里面有两张人脸,两个人,人脸的位置,人的位置,图片的大小,图片的深度

  仔细观察不难发现,里面就是一些字典的嵌套,知道了这一点,那接下来就好办了
首先导入处理json需要的类库json

import json

接下来以文件的形式打开json文件

f_path = r'H:\Datasets\YOLO\person\outputs\json\15.json'
with open(f_path) as f

然后用json类库提取全部内容,并打印出来看下

labels = json.load(f)
print(labels)

print结果:

{‘path’: ‘E:\Datasets\YOLO\person\imgs\15.jpg’, ‘outputs’: {‘object’: [{‘name’: ‘face’, ‘bndbox’: {‘xmin’: 48, ‘ymin’: 41, ‘xmax’: 74, ‘ymax’: 77}}, {‘name’: ‘face’, ‘bndbox’: {‘xmin’: 185, ‘ymin’: 16, ‘xmax’: 216, ‘ymax’: 57}}, {‘name’: ‘person’, ‘bndbox’: {‘xmin’: 15, ‘ymin’: 31, ‘xmax’: 179, ‘ymax’: 366}}, {‘name’: ‘person’, ‘bndbox’: {‘xmin’: 153, ‘ymin’: 6, ‘xmax’: 298, ‘ymax’: 375}}]}, ‘time_labeled’: 1575946134777, ‘labeled’: True, ‘size’: {‘width’: 416, ‘height’: 416, ‘depth’: 3}}

到此,就把整个文件的内容全部加载到label这个字典里了,接下来就用字典的技术遍历这个字典。

先我们看下这个字典里有哪些键:

keys = labels.keys()
# print(labels.keys())
print(keys)

>dict_keys(['path', 'outputs', 'time_labeled', 'labeled', 'size'])	# print输出

知道这些键以后,就可以根据键查找对应的值。

# 查看path
path = labels['path']
# print(labels['path'])
print(path)

>E:\Datasets\YOLO\person\imgs\15.jpg				# print输出
# 查看 outputss
outputs = labels['outputs']
print(outputs)

>{'object': [{'name': 'face', 'bndbox': {'xmin': 48, 'ymin': 41, 'xmax': 74, 'ymax': 77}}, {'name': 'face', 'bndbox': {'xmin': 185, 'ymin': 16, 'xmax': 216, 'ymax': 57}}, {'name': 'person', 'bndbox': {'xmin': 15, 'ymin': 31, 'xmax': 179, 'ymax': 366}}, {'name': 'person', 'bndbox': {'xmin': 153, 'ymin': 6, 'xmax': 298, 'ymax': 375}}]}

What?这么长一串是什么鬼,看不懂。
没关系,只要你认出 { 这个玩意儿表示字典就行。既然是字典,那就有键值,就可以查看里面的键

print(outputs.keys())

>dict_keys(['object'])		# print输出

里面只要一个键‘object’,输出看看

object = outputs['object']
print(object)

> [{'name': 'face', 'bndbox': {'xmin': 48, 'ymin': 41, 'xmax': 74, 'ymax': 77}}, 
   {'name': 'face', 'bndbox': {'xmin': 185, 'ymin': 16, 'xmax': 216, 'ymax': 57}}, 
   {'name': 'person', 'bndbox': {'xmin': 15, 'ymin': 31, 'xmax': 179, 'ymax': 366}}, 
   {'name': 'person', 'bndbox': {'xmin': 153, 'ymin': 6, 'xmax': 298, 'ymax': 375}}
  ]

貌似有点头绪了,里面是个列表,列表里面有四个元素(也就是那四个字典),分别是两个人脸和两个人。列表就可以用循环遍历了,字典继续用键取值。试试

for obj in object:
    print('{0}  box({1}, {2}, {3}, {4})'.format(obj['name'], obj['bndbox']['xmin'], 
          obj['bndbox']['ymin'], obj['bndbox']['xmax'], obj['bndbox']['ymax']))

> face  box(48, 41, 74, 77)
  face  box(185, 16, 216, 57)
  person  box(15, 31, 179, 366)
  person  box(153, 6, 298, 375)

到此,怎么解析json文件就算是结束了,自己动手试试吧
把上面的文件内容复制到记事本里面,保存为 “文件名.json”,然后把文件的路径复制到代码里的f_path的地方,运行代码看看吧

附:解析代码
import json
f_path = r'H:\Datasets\YOLO\person\outputs\json\15.json'
with open(f_path) as f:
    labels = json.load(f)
    keys = labels.keys()
    print(labels.keys())
    
    path = labels['path']
    print(path)

    size = labels['size']
    print(size)

    width = size['width']
    print(width)

    outputs = labels['outputs']
    print(outputs.keys())
    
    object = outputs['object']
    print(object)
    for obj in object:
        print('{0}  box({1}, {2}, {3}, {4})'.format(obj['name'], obj['bndbox']['xmin'],
                obj['bndbox']['ymin'], obj['bndbox']['xmax'], obj['bndbox']['ymax']))