详解python数据结构和算法

程序员文章站 2022-12-04 12:17:14

1.删除序列相同元素并保持顺序如果仅仅就是想消除重复元素，通常可以简单的构造一个集合，利用集合之间元素互不相同的特性就可以消除重复，但是这种方法生成的结果中元素的位置会...

1.删除序列相同元素并保持顺序

如果仅仅就是想消除重复元素，通常可以简单的构造一个集合，利用集合之间元素互不相同的特性就可以消除重复，但是这种方法生成的结果中元素的位置会被打乱。下面是我们的解决方案：

def dedupe(items, key=none):
  seen = set()
  for item in items:
    val = item if key is none else key(item)
    if val not in seen:
      yield item
      seen.add(val)

主要思想就是构造一个集合，然后遍历该列表，如果当前元素不存在集合中就将该元素返回。

yiled时python中构造生成器的关键字。碰到yiled就返回该变量，下一次则从yiled之后的语句开始执行。

使用示例：

详解python数据结构和算法

注：我们构造的dedupe函数返回的是生成器对象，需要用list转化成可直接输出的列表。

该函数也可以用来文件去除重复行：

with open('my.log','r') as f:
  for item in dedupe(f):
    print(item)

2.过滤元素序列

问题--------你有一个数据序列，想利用一些规则从中提取出需要的值或者是缩短序列

方法一：最简单的过滤序列元素的方法就是使用列表推导。比如我们想从下列列表中提取正数：

mylist = [1, 4, -5, 10, -7, 2, 3, -1]
newlist = [n for n in mylist if n > 0]
print(newlist)

方法二：生成器迭代

使用列表推导的一个潜在缺陷就是如果输入非常大的时候会产生一个非常大的结果集，占用大量内存。如果你对内存比较敏感，那么你可以使用生成器表达式迭代产生过滤的元素。

mylist = [1, 4, -5, 10, -7, 2, 3, -1]
pos = (n for n in mylist if n > 0)
print(pos) 
print(list(pos)) #迭代器不可以直接输出，需要转换成list才可以看到结果

运行结果：

详解python数据结构和算法

方法三：过滤规则比较复杂，不能简单的在列表推导或者生成器表达式中表达出来时需要考虑使用内建的filter函数。这时候你可以将过滤代码放到一个函数中，然后使用内建的 filter() 函数。示例如下：

values = ['1', '2', '-3', '-', '4', 'n/a', '5']
def is_int(val):
  try:
    x = int(val)
    return true
  except valueerror:
    return false
ivals = list(filter(is_int, values))
print(ivals)
# outputs ['1', '2', '-3', '4', '5']

以上所述是小编给大家介绍的python数据结构和算法详解整合，希望对大家有所帮助

上一篇：司马炎为什么会选一个*当皇帝？

下一篇：武则天的四大男宠分别是谁？最后怎么死的？

详解python数据结构和算法

python 排序算法总结及实例详解

java数据结构排序算法之树形选择排序详解

java数据结构排序算法之归并排序详解

Python迭代和迭代器详解

python 排序算法总结及实例详解

详解java数据结构与算法之双链表设计与实现

Python基础学习之基本数据结构详解【数字、字符串、列表、元组、集合、字典】

MySQL索引背后的数据结构及算法原理详解

Python中的变量和作用域详解

Python中列表和元组的使用方法和区别详解