在python中利用pandas和正则表达式读取文件
程序员文章站
2022-09-13 22:46:32
在python中利用pandas和正则表达式读取文件利用python读取一个如图所示的txt,共4039行,要求跳过第一行,每一行的第一个数存在字典的键中,字典的值为一个列表,里面记录每行对应的数字,列表长度为每行第二个数字,但该数字不记录在列表中。并且要求所有的1.00不读入进去具体解决方案如下import networkx as nx #引入复杂网络networkx模块import pymongo #引入相关模块操控mongodb模块import pandas as pd #引入pandas...
在python中利用pandas和正则表达式读取文件
利用python读取一个如图所示的txt,共4039行,要求跳过第一行,每一行的第一个数存在字典的键中,字典的值为一个列表,里面记录每行对应的数字,列表长度为每行第二个数字,但该数字不记录在列表中。并且要求所有的1.00不读入进去
具体解决方案如下
import networkx as nx #引入复杂网络networkx模块
import pymongo #引入相关模块操控mongodb模块
import pandas as pd #引入pandas模块用来读取数据
import re #正则表达式
#facebook真实网络
mongodb_link = pymongo.MongoClient(host='localhost', port=27017) #创建mogondb连接
db = mongodb_link.model #创建一个名为model的数据库
collection = db.facebook_model #在model数据库下创建一个名为facebook_model的集合,类似于关系型数据库中的表
data = pd.read_table(r'E:\project\kq\kq_cascade\network\Facebook_net.txt',sep = ',',skip_blank_lines = True) #读取facebook真实网络的数据
rows = data.shape[0] #获取数据行数
my_list = [] #空列表
change_list = []
lists = [[]for i in range(rows)] #二维列表存储
my_data = { }
dict_G = { } #空字典用来存储数据
for i in range(rows):
my_list.append(data.iat[i,0])
for i in range(len(my_list)):
change_list.append(re.findall(r"\d+\.?\d*",my_list[i]))
for i in range(len(change_list)):
del change_list[i][0]
for i in range(len(change_list)):
del change_list[i][0]
for i in range(len(change_list)):
for j in range(len(change_list[i])):
if change_list[i][j] != "1.00":
lists[i].append(change_list[i][j])
else:
continue
for i in range(len(lists)):
my_data[i] = lists[i]
#将网络转换成字典
G = nx.from_dict_of_lists(my_data)
mydict = { } #空字典用来改变dict_G键的类型把数据存入mongodb
for key in my_data:
mydict[str(key+1)] = my_data[key]
result = collection.insert_one(mydict) #插入mongodb数据库
本文地址:https://blog.csdn.net/xiaotai1234/article/details/107160869
上一篇: 荐 【Java】--创建线程方法之Callable
下一篇: python多进程实现进程间通信实例
推荐阅读
-
在.NET中读取嵌入和使用资源文件的方法
-
在Python中利用Pandas库处理大数据的简单介绍
-
在python中利用GDAL对tif文件进行读写的方法
-
在python中pandas读文件,有中文字符的方法
-
利用Python中的输入和输出功能进行读取和写入的教程
-
在Python程序中进行文件读取和写入操作的教程
-
解决python中os.listdir()函数读取文件夹下文件的乱序和排序问题
-
在python中利用pandas和正则表达式读取文件
-
在python平台上利用pymol来查找PDB文件中蛋白质的相互作用位点
-
Python读取txt文件应用---用python实现读取一个txt文档,并根据相应判断条件在txt文件中,每一行内写入指定数据。