数据的获取与读取篇---常见的数据格式JSON
文件格式
假如你有一份想分析的数据文件,获得文件后下一步就是用代码读取它。不同的文件格式有不同的读取方法。所以读取前了解文件格式也很重要。你可能见过非常多的文件格式,例如TXT、MP3、PDF、JPEG等等。
一般可以通过文件的后缀来分辨文件的格式,例如TXT格式,一般保存为txt结尾的文件。但是文件名后缀只是文件名的一部分,更改后缀不影响实际的文件格式。例如你非要把一个TXT格式的文件名字改成以.mp3结尾也是可以的,操作系统会根据后缀匹配打开那个文件的程序,所以更改后电脑就会用音乐播放器去打开那个文件,导致文件无法被正常打开。也就是说后缀名会影响电脑选择用什么软件去打开它,但更改后缀并不改变文件里的内容,因此不影响实际的格式。
JSON数据格式
一种程序员非常喜欢的数据格式是JSON,全称是JavaScript Object Notation,意思是JavaScript对象表示法,可见这种数据格式和JavaScript的语法是有些关联的。JSON与Python的字典或列表有非常相似之处,而且被无数主流编程语言支持。JSON这种数据格式自然是用来存储和交换信息。我们之前提到过的用API获取数据这个方式,很多时候数据都是以JSON格式进行返回的,因为JSON占用体积小,还能非常容易被转换成程序语言自己的结构。
JSON的数据结构
具体语法方面:JSON有两种数据结构:JSON对象和JSON数组可以分别被转成Python字典和列表。
//JSON对象{"id":"1","type":"article","title":"wor