集合总结

List与Set区别

List,Set都是继承自Collection接口
List特点:元素有放入顺序,元素可重复
Set特点:元素无放入顺序,元素不可重复,重复元素会覆盖
注意:元素虽然无放入熟顺序,但是元素在Set中的位置是该元素的HashCode决定的,其位置其实是固定的,加入Set的Object必须定义equals()方法,另外List支持for循环,也就是通过下标来遍历,也可以用迭代器,但是Set只能用迭代,因为他无序,无法用下标来取得想要的值。
Set和List对比:
Set:检索元素效率低下,删除和插入效率高,插入和删除不会引起元素位置变化。
List:和数组类似,List可以动态增长,查找元素效率高,插入删除元素效率低,因为会引起其他元素位置改变。


List和Map区别

List是对象集合,允许对象重复。
Map是键值对的集合,不允许键(key)重复。


ArrayList和LinkedList区别

ArrayList:

优点:ArrayList是实现了基于动态数组的数据结构,因为地址连续,一旦数据存储好了,查询操作效率会比较高(在内存里是连着放的)。
缺点:因为地址连续,ArrayList要移动数据,所以插入和删除的操作效率比较低。

LinkedList:

优点:LinkedList基于链表的数据结构,地址是任意的,所以在开辟内存空间的时候不需要等一个连续的地址,对于新增和删除操作add和remove,LinkedList比较占优势。LinkedList适合用于要头尾操作或插入指定位置的场景。
缺点:因为LinkedList要移动指针,所以查询操作性能比较低。

比较来说:

1.ArrayList是实现了基于动态数组的数据结构,LinkedList是基于链表结构。
2.对于随机访问的get和set方法,ArrayList要优于LinkedList,因为LinkedList要移动指针。
3.对于新增和删除操作add和remove,LinkedList比较占优势,因为ArrayList要移动数据。

性能上:

1.对ArrayList和LinkedList而言,在列表末尾增加一个元素所花的开销都是固定的。对 ArrayList而言,主要是在内部数组中增加一项,指向所添加的元素,偶尔可能会导致对数组重新进行分配;而对LinkedList而言,这个开销是 统一的,分配一个内部Entry对象。
2.在ArrayList集合中添加或者删除一个元素时,当前的列表中所有的元素都会被移动。而LinkedList集合中添加或者删除一个元素的开销是固定的。
3.LinkedList集合不支持 高效的随机随机访问(RandomAccess),因为可能产生二次项的行为。
4.ArrayList的空间浪费主要体现在在list列表的结尾预留一定的容量空间,而LinkedList的空间花费则体现在它的每一个元素都需要消耗相当的空间


ArrayList与Vector区别

ArrayList构造方法:

public ArrayList(int initialCapacity)//构造一个具有指定初始容量的空列表。
public ArrayList()//构造一个初始容量为10的空列表。
public ArrayList(Collection<? extends E> c)//构造一个包含指定collection 的元素的列表。

Vector构造方法:

public Vector()//使用指定的初始容量和等于零的容量增量构造一个空向量。
public Vector(int initialCapacity)//构造一个空向量,使其内部数据数组的大小,其标准容量增量为零。
public Vector(Collection<? extends E> c)//构造一个包含指定 collection 中的元素的向量
public Vector(int initialCapacity,int capacityIncrement)//使用指定的初始容量和容量增量构造一个空的向量

ArrayList和Vector都是用数组实现的,主要有这么三个区别:

  1. Vector是多线程安全的,线程安全就是说多线程访问同一代码,不会产生不确定的结
    果。而ArrayList不是,这个可以从源码中看出,Vector类中的方法很多有synchronized
    进行修饰,这样就导致了Vector在效率上无法与ArrayList相比;
  2. 两个都是采用的线性连续空间存储元素(底层是数组结构),但是当空间不足的时候,两个类的增加方式是不同的。
  3. Vector可以设置增长因子(每次容量不够时,增加的长度,默认是增加一倍),而ArrayList不可以。
  4. Vector是一种老的动态数组,是线程同步的,效率很低,一般不赞成使用。

适用场景分析:

  1. Vector是线程同步的,所以它也是线程安全的,而ArrayList是线程异步的,是不安全的。如果不考虑到线程的安全因素,一般用ArrayList效率比较高。
  2. 如果集合中的元素的数目大于目前集合数组的长度时,在集合中使用数据量比较大的数据,用Vector有一定的优势


HashMap和Hashtable区别

HashMap和Hashtable区别:

1.HashMap去掉了Hashtable 的contains方法,但是加上了containsValue()和
containsKey()方法。
2.Hashtable同步的,而HashMap是非同步的,效率上比Hashtable要高。
3.HashMap允许空键值,而HashTable不允许。

注意:

TreeMap:非线程安全基于红黑树实现。TreeMap没有调优选项,因为该树总处于平衡状态。
Treemap:适用于按自然顺序或自定义顺序遍历键(key)。


HashSet 和 HashMap 区别

HashSet:

set是线性结构,set中的值不能重复,hashset是set的hash实现,HashSet使用成员对象来计算hashcode值,对于两个对象来说hashcode可能相同,所以equals()方法用来判断对象的相等性,如果两个对象不同的话,那么返回false。

HashMap:

map是键值对映射,可以空键空值。HashMap是Map接口的hash实现,key的唯一性是通过key值的hash值的唯一来确定,value值是则是链表结构。
他们的共同点s都是hash算法实现的唯一性,他们都不能持有基本类型,只能持有对象


HashMap 和 ConcurrentHashMap 的区别

ConcurrentHashMap是线程安全的HashMap的实现:

ConcurrentHashMap对整个桶数组进行了分割分段(Segment),然后在每一个分段上
都用lock锁进行保护,相对于HashTable的syn关键字锁的粒度更精细了一些,并发性能更好,而HashMap没有锁机制,不是线程安全的。
HashMap的键值对允许有null,但是ConCurrentHashMap都不允许。

ConcurrentHashMap 的工作原理及代码实现:

HashTable里使用的是synchronized关键字,这其实是对对象加锁,锁住的都是对象整体,当Hashtable的大小增加到一定的时候,性能会急剧下降,因为迭代时需要被锁定很长的时间。ConcurrentHashMap算是对上述问题的优化,其构造函数如下,默认传入的是16,0.75,16。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
public ConcurrentHashMap(int paramInt1, float paramFloat, int paramInt2) {
int i = 0;
int j = 1;
while (j < paramInt2) {
++i;
j <<= 1;
}
this.segmentShift = (32 ‐ i);
this.segmentMask = (j ‐ 1);
this.segments = Segment.newArray(j);
int k = paramInt1 / j;
if (k * j < paramInt1)
++k;
int l = 1;
while (l < k)
l <<= 1;
for (int i1 = 0; i1 < this.segments.length; ++i1)
this.segments[i1] = new Segment(l, paramFloat);
}
public V put(K paramK, V paramV) {
if (paramV == null)
throw new NullPointerException();
int i = hash(paramK.hashCode()); //这里的hash函数和HashMap中的不一样
return this.segments[(i >>> this.segmentShift &
this.segmentMask)].put(paramK, i, paramV, false);
}

ConcurrentHashMap引入了分割(Segment),上面代码中的最后一行其实就可以理解为把一个大的Map拆分成N个小的HashTable,在put方法中,会根据hash(paramK.hashCode())来决定具体存放进哪个Segment,如果查看Segment的put操作,我们会发现内部使用的同步机制是基于lock操作的,这样就可以对Map的一部分(Segment)进行上锁,这样影响的只是将要放入同一个Segment的元素的put操作,保证同步的时候,锁住的不是整个Map(HashTable就是这么做的),相对于HashTable提高了多线程环境下的性能,因此HashTable已经被淘汰了。

-------------本文结束感谢您的阅读-------------