欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

数据预处理实验二

程序员文章站 2022-06-26 16:06:54
一、实验概述:【实验目的】初步掌握数据采集的方法;初步掌握利用爬虫爬取网络数据的方法掌握不同数据格式之间的转换方法;【实施环境】(使用的材料、设备、软件)Linux或Windows操作系统环境,MySql数据库,Python或其他高级语言二、实验内容第1题 爬取网络数据【实验要求】爬取酷狗音乐网站(https://www.kugou.com/)上榜单前500名的歌曲名称,演唱者,歌名和歌曲时长将爬取的数据以JSon格式文件保存。读取JSON格式任意数据,检验文件格式是否正确。...

一、实验概述:
【实验目的】

  1. 初步掌握数据采集的方法;
  2. 初步掌握利用爬虫爬取网络数据的方法
  3. 掌握不同数据格式之间的转换方法;

【实施环境】(使用的材料、设备、软件)
Linux或Windows操作系统环境,MySql数据库,Python或其他高级语言

二、实验内容
第1题 爬取网络数据
【实验要求】

  1. 爬取酷狗音乐网站(https://www.kugou.com/)上榜单前500名的歌曲名称,演唱者,歌名和歌曲时长
  2. 将爬取的数据以JSon格式文件保存。
  3. 读取JSON格式任意数据,检验文件格式是否正确。

【实验过程】(步骤、记录、数据、程序等)
请提供操作步骤及界面截图证明。

第2题 编程生成CSV文件并转换成JSon格式
【实验要求】

  1. 编程生成CSV格式文件。文件内容如下:
    姓名,性别,籍贯,系别
    张迪,男,重庆,计算机系
    兰博,男,江苏,通信工程系
    黄飞,男,四川,物联网系
    邓玉春,女,陕西,计算机系
    周丽,女,天津,艺术系
    李云,女,上海,外语系
  2. 将上述CSV格式文件转换成JSon格式,并查询文件中所有女生的信息。
    【实验过程】(步骤、记录、数据、程序等)
    请提供操作步骤及界面截图证明。

第3题. XML格式文件与JSon的转换
【实验内容集要求】
(1) 读取以下XML格式的文件,内容如下:

<?xml version=”1.0” encoding=”gb2312”> <图书> <书名>红楼梦

本文地址:https://blog.csdn.net/qq_43572935/article/details/108783027