今天在处理自动化邮件数据时碰到数据行中包含字符串后,从hive中拿到的整数型数据自动转化成了浮点数,严重影响美观性。因此想到了用列表推导式来做转化,将其中的数字型数据全部转化为整型,而字符型数据保留原样。


列表推导式总共有两种形式:

①[x for x in data if condition]

    此处if主要起条件判断作用,data数据中只有满足if条件的才会被留下,最后统一生成为一个数据列表

②[exp1 if condition else exp2 for x in data]

    此处if...else主要起赋值作用,当data中的数据满足if条件时将其做exp1处理,否则按照exp2处理,最后统一生成为一个数据列表


例子如下:

data = ['driver', '2017-07-13', 1827.0, 2058.0, 978.0, 1636.0, 1863.0, 2537.0, 1061.0]

(1)若我要取得以上列表中值大于2000的数值,这里可以使用列表推导式的形式①:

[x for x in data if x > 2000]

得到如下结果(字符串类型数据被认为是无穷大数):

 ['driver', '2017-07-13', 2058.0, 2537.0]

(2)若要解决我上面提到的问题,则需要使用列表推导式的形式②

[int(x) if type(x) == float else x for x in data]

得到结果:

 ['driver', '2017-07-13', 1827, 2058, 978, 1636, 1863, 2537, 1061]