欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

clojure-基本语法-集合(二)

程序员文章站 2022-05-21 09:17:42
...
三、映射Map
Map存储一个键-值对的集合。键和值都可以是任何数据类型的对象,无论是基本数据类型还是其它映射。然而,使用关键字来作为映射的键非常合适,因此它们经常在应用映射的场合被使用。clojure的Map有三种实现方式:数组映射、哈希映射和有序映射。它们分别使用数组、哈希表和二叉树来作为底层实现。数组映射适用于较小的映射,而对哈希映射和有序映射的比较则要基于特定应用场合的情况。Map形式以“{:a 1 :b 2}“符号表示
创建Map的方式:
1、简单定义
直接通过def绑定某个符号为映射形式,如下:
user=> (def my-map {:a 1 :b 2 :c 3})
#'user/my-map
user=> (type my-map);type查看符号的类型,这里默认采用哈希映射
clojure.lang.PersistentHashMap


2、hash-map:
创建哈希映射
user=> (hash-map)
{}
user=> (hash-map :key1 1, :key2 2)
{:key2 2, :key1 1}
user=> (def user {:name "steve" :age 24 :salary 8000 :company "ibm"})
#'user/user


3、array-map:
array-map创建数组映射,也有资料说是有序映射(不是根据key排序的意思,而是根据元素的初始顺序,相对于hash-map中key的位置不确定而言)
user=> (array-map :b 1 :a 2 :c 3)
{:b 1, :a 2, :c 3}
user=> (def am (array-map  :b 1 :a 2 :c 3))
#'user/am
user=> (type am)
clojure.lang.PersistentArrayMap


4、sorted-map:
sorted-map对键进行比较:根据数字或者字母表进行排序。
user=> (type (sorted-map));底层实现方式为PersistentTreeMap
clojure.lang.PersistentTreeMap
user=> (sorted-map :b 2 :a 1)
{:a 1, :b 2}
user=> (sorted-map 0 0 2 2 1 1)
{0 0, 1 1, 2 2}


5、zipmap:
zipmap使用给定的keys映射到匹配的vals,返回一个数组映射,如下:
user=> (def zm (zipmap [:a :b :c :d :e] [1 2 3 4 5]))
#'user/zm
user=> (type zm)
clojure.lang.PersistentArrayMap
user=> zm
{:e 5, :d 4, :c 3, :b 2, :a 1}
user=> (zipmap [:a :b :c] [1 2 3 4])
{:c 3, :b 2, :a 1}


6、sorted-map-by:
使用提供的比较器,返回一个新建的有序映射。如下:
user=> (sorted-map-by > 1 "a", 2 "b", 3 "c")
{3 "c", 2 "b", 1 "a"}
user=> (sorted-map-by < 1 "a", 2 "b", 3 "c")
{1 "a", 2 "b", 3 "c"}


7、bean:
根据java对象,返回该对象的属性构成的map,这里待分析与java互操作时再说明。

8、frequencies:
根据集合中元素出现的次数,构成一个数组映射。如下:
user=> (frequencies [1 2 1 1 "a" "b" "a"])
{1 3, 2 1, "a" 2, "b" 1}
user=> (type (frequencies [1 2 1 1 "a" "b" "a"]))
clojure.lang.PersistentArrayMap


操作Map的函数:
1、assoc(更新):
在vector部分已经提到assoc,不过assoc函数作用在map上,相当于把参数中的key value对添加到已有map中,如果key相同,则更新成参数中的value。
user=> (assoc {} :key1 "value1" :key2 2)
{:key2 2, :key1 "value1"}
user=> (assoc {:key1 "old value"} :key1 "new value")
{:key1 "new value"}


2、dissoc(删除):
dissoc函数是将map中指定的key丢弃掉,并返回新的map
user=> (dissoc {:a 1 :b 2 :c 3} :b);丢弃key为:b的元素
{:a 1, :c 3}
user=> (dissoc {:a 1 :b 2 :c 3});没有key的参数时,直接返回
{:a 1, :c 3, :b 2}
user=> (dissoc {:a 1 :b 2 :c 3} :d);
{:a 1, :c 3, :b 2}
user=> (dissoc {:a 1 :b 2 :c 3} :a :b :c)
{}


3、find:
find函数接收两个参数,第一个参数为map,第二个参数为key,在map中查找key对应的元素,找不到返回nil,找到返回该元素(即键值对),如下:
user=> (find {:a 1 :b 2} :c)
nil
user=> (find {:a 1 :b 2} :a)
[:a 1]

实际上,find也可作用在vector上,从vector中查找索引对应的元素,找到后,返回索引位置与值组成的新的vector,找不到,直接返回nil。代码如下:
user=> (find [1 2 3] 2)
[2 3]
user=> (find [1 2 3] 4)
nil


4、key:
key的参数为map中的元素(entry),所以不能直接把key作用在map上。key用于返回元素的key名称
user=> (map key {:a 1 :b 2});map的作用在后续详细介绍
(:a :b)
user=> (key (first {:a 1 :b 2}));first函数返回map的第一个元素作为key的参数
:a


5、keys:
keys的参数为map,返回map中的key组成列表
user=> (keys {:a 1 :b 2})
(:a :b)


6、val:
与key类似,参数为map元素(entry),返回元素的value值
user=> (val (first {:one :two}))
:two


7、vals:
与keys类似,参数为map,返回map中的value组成的列表
user=> (vals {:a 1 :b 2})
(1 2)


8、get:
在vector时也用到get,用于返回指定位置的元素。get作用在map上,是返回指定key的对应的value,如果找不到,也可返回指定的提示信息,如下:
user=> (get {:a 1 :b 2} :b)
2
user=> (get {:a 1 :b 2} :z "missing")
"missing"


9、get-in:
get-in适用于多层嵌套的情况,如下:
user=> (((({:n "qh", :addr {:cn {:bj {:hd "tsinghua"}}}} :addr) :cn) :bj) :hd);不用get-in时
"tsinghua"
user=> (get-in {:n "qh", :addr {:cn {:bj {:hd "tsinghua"}}}} [:addr :cn :bj :hd]);使用get-in方式
"tsinghua"


10、select-keys:
用于选择key,返回包含指定key的map
user=> (select-keys {:a 1 :b 2} [:a])
{:a 1}
user=> (select-keys {:a 1 :b 2} [:a :c])
{:a 1}


11、assoc-in(更新):
assoc-in函数用于更新map中指定key对应的值:
user=> (assoc-in {:name "tom" :age 26} [:age] 36)
{:age 36, :name "tom"}


12、update-in(更新):
update-in函数用于更新map中指定key对应的值,不过更新方式使用第三个参数(函数)
user=> (update-in {:name "qh" :age 30} [:age] #(inc %))
{:age 31, :name "qh"}
user=> (update-in {:a 3} [:a] / 4 5)
{:a 3/20}


13、merge(更新):
merge函数用于合并多个map为一个新的map,如果key相同,则保留后一个参数map的key对应值
user=> (merge {:name "qh" :age 30} {:gender 'm :mail "qh@mail"})
{:mail "qh@mail", :gender m, :age 30, :name "qh"}
;这里也可以用conj
user=> (conj {:name "qh" :age 30} {:gender 'm :mail "qh@mail"})
{:mail "qh@mail", :gender m, :age 30, :name "qh"}


14、merge-with(更新):
merge-with可以作为merge的升级版,不仅合并map,还能以第一个参数(函数)对key相同的value做处理。
user=> (merge-with + {:a 1 :b 2} {:a 2 :b 98 :c 0})
{:c 0, :a 3, :b 100}


操作SortedMap的函数:
1、rseq:
对有序映射的逆转函数,如下:
user=> (rseq (sorted-map :a 1 :c 2 :b 4))
([:c 2] [:b 4] [:a 1])


2、subseq:
对有序映射执行比较(支持>、>=、<、<=),比较结果为true,添加到列表中,并返回
user=> (subseq (sorted-map :a 1 :c 2 :b 4) < :b)
([:a 1])
user=> (subseq (sorted-map :a 1 :c 2 :b 4) >= :b)
([:b 4] [:c 2])


3、rsubseq:
对有序映射执行比较(支持>、>=、<、<=),比较结果为true,添加到列表中,并对列表结果逆转后返回,如下:
user=> (rsubseq (sorted-map :a 1 :c 2 :b 4) >= :b)
([:c 2] [:b 4])


四、集合Set
Set是一个包含不重复元素的集合。当我们要求集合里面的元素不可以重复,并且我们不要求集合里面的元素保持它们添加时候的顺序,那么使用set比较合适。Set形式以“#{1,2,3}”符号表示。Set可以使用哈希表或二叉树来实现,使用 hash-set 或者 sorted-set 函数
创建集合Set的方式:
1、简单定义:
user=> (def languages #{:java :list :c++})
#'user/languages
user=> languages
#{:c++ :list :java}


2、set:
使用set函数转换其他集合类型为set类型,并且去除重复元素,如下:
user=> (set '(1 1 2 3 4 4 5))
#{1 2 3 4 5}
user=> (set [1 1 2 3 4 4 5])
#{1 2 3 4 5}
user=> (set "abcd")
#{\a \b \c \d}
user=> (set "abccdd")
#{\a \b \c \d}
user=> (set {:one 1 :two 2 :three 3})
#{[:two 2] [:three 3] [:one 1]}


3、hash-set:
使用hash-set创建基于哈希表的集合,如下:
user=> (hash-set :a :b :c)
#{:a :c :b}
user=> (hash-set 3 2 1 2);通过hash-set创建set时,需要检查给定的key是否重复
IllegalArgumentException Duplicate key: 2  clojure.lang.PersistentHashSet.create
WithCheck (PersistentHashSet.java:80)


4、sorted-set:
使用sorted-set创建基于二叉树的集合,如下:
user=> (sorted-set 3 2 1)
#{1 2 3}
user=> (sorted-set 3 2 1 1);通过sorted-set创建set时,不检查key是否重复
#{1 2 3}

为何这里不检查key重复,而hash-set检查出现重复时抛出异常?
原因如下:
;使用source查看函数的源码
user=> (source hash-set)
(defn hash-set
  "Returns a new hash set with supplied keys."
  {:added "1.0"
   :static true}
  ([] #{})
  ([& keys]
   (clojure.lang.PersistentHashSet/[color=red]createWithCheck[/color] keys)))
nil
user=> (source sorted-set)
(defn sorted-set
  "Returns a new sorted set with supplied keys."
  {:added "1.0"
   :static true}
  ([& keys]
   (clojure.lang.PersistentTreeSet/[color=red]create[/color] keys)))
nil

hash-set函数调用clojure.lang.PersistentHashSet类的createWithCheck方法(一般clojure里集合创建时,方法名称为createWithCheck的就表示创建时需要检查参数的合法性),而sorted-set函数调用clojure.lang.PersistentTreeSet的create方法(一般方法名称为create表示对参数不做检查)

5、sorted-set-by:
sorted-set-by方法根据比较函数,确定set的排序规则,如下:
user=> (sorted-set-by > 3 5 8 2 1)
#{8 5 3 2 1}
user=> (sorted-set-by <  3 5 8 2 1)
#{1 2 3 5 8}


操作Set的常用函数:
1、conj:
根据给定的元素增加到第一个参数指向的set集合中,如下:
user=> (conj #{1 3} 1 5 7)
#{1 3 5 7}


2、disj:
根据给定的元素,从第一个参数指向的set集合中删除匹配的元素,如下:
user=> (disj #{1 3 5 7} 3 7)
#{1 5}


3、其它方式:
user=> (clojure.set/union #{1 2 3} #{1 2 4});合并子集
#{1 2 3 4}
user=> (clojure.set/select even? #{1 2 3 4 5});根据条件选择
#{2 4}
user=> (clojure.set/difference #{1 2 3} #{1 2 4});取差集
#{3}
user=> (clojure.set/intersection #{1 2 3} #{1 2 4});取交集
#{1 2}
相关标签: clojure