Python基础知识17——使用API
一、使用Web API
Web API是网站的一部分,用于与使用非常具体的URL请求特定信息的程序互交。这种请求称为API调用,请求的数据将以易于处理的格式返回(JSON/CSV)。
1. Git和GitHub
GitHub(https://github.com/)
Git是一个分布式版本控制系统,让程序员团队能够协作开发项目。
GitHub上的项目都存储在仓库中,包含与项目相关联的一切:代码、项目参与者的信息,问题或者bug报告等。
2. 使用API调用请求数据
https://api.github.com/search/repositories?q=language:python&sort=stars
分析:
- 第一部分:https://api.github.com
将请求发送到GitHub网站中响应API调用的部分 - 第二部分:search/repositories
让API搜索GitHub上的所有仓库 - 第三部分:问号(
?
)后指出我们要传递的实参
q表示查询,q=language:python,只想获取主要语言为Python的仓库信息;
sort表示排序,指定将项目按其获得的星级进行排序。
3. 安装requests
requests包让Python程序能够轻松地向网站发送请求信息,以及检查返回的响应。安装命令:pip install --user requests
4. 处理API响应
下面编写一个程序,执行API调用并处理结果,找出GitHub上星级最高的Python项目。
import requests
# 执行API调用并存储响应信息
url = "https://api.github.com/search/repositories?q=language:python&sort=stars"
r = requests.get(url)
print("Status code:",r.status_code)
# 将API响应存储在一个变量中
response_dict = r.json()
# 处理结果
print(response_dict.keys())
运行结果:
Status code: 200
dict_keys(['total_count', 'incomplete_results', 'items'])
5. 处理字典响应
将API调用返回的信息存储到字典中后,就可以处理这个字典中的数据了。
import requests
# 执行API调用并存储响应信息
url = "https://api.github.com/search/repositories?q=language:python&sort=stars"
r = requests.get(url)
print("Status code:",r.status_code)
# 将API响应存储在一个变量中
response_dict = r.json()
print("Total repositories: ",response_dict['total_count'])
# 搜索有关仓库的信息
response_dict = response_dict['items']
print("Repositories returned:",len(response_dict))
# 处理结果
repo_dict = response_dict[0]
# print(repo_dict)
print("\nKeys:",len(response_dict))
for key in sorted(repo_dict.keys()):
print(key)
6. 概述最受欢迎的仓库
7. 监视API的速率限制
https://api.github.com/rate_limit
{
--snip--
"search": {
"limit": 10,
"remaining": 10,
"reset": 1570366257
},
--snip--
}
limit:极限是每分钟10个请求
remaining:还可以执行10个请求
reset:配额将重置的Unix时间或新纪元时间
二、使用Pygal可视化仓库
创建交互式条形图:条形的高度表示项目获得了多少颗星。
1. 改进Pygal图表
2. 添加自定义工具提示
3. 根据数据绘图
4. 在图表中添加可单击的链接
三、Hacker News API
四、小结
上一篇: com.microsoft.sqlserver.jdbc.SQLServerException: 传入的请求具有过多的参数。该服务器支持最多 2100 个参数。请减少参数的数目,然后重新发送该请求。
下一篇: Java并发编程中的底层原理
推荐阅读