引入问题
首先,我自定义了一个名为 person
的 java 类:
public class person { private string name; private int age; public person(string name, int age) { this.name = name; this.age = age; } @override public int hashcode() { return super.hashcode(); } @override public boolean equals(object obj) { return super.equals(obj); } @override public string tostring() { return "person{" + "name='" + name + '\'' + ", age=" + age + '}'; } }
person
类中有两个属性:name
和 age
和一个全参构造方法:
name
是一个字符串类型的变量,用于表示人的姓名;age
是一个整数类型的变量,用于表示人的年龄。- 构造方法用于创建
person
类的对象。
并且重写了三个方法:hashcode()
、equals()
和 tostring()
:
hashcode()
方法返回对象的哈希码,此处直接调用了父类object
的hashcode()
方法。equals()
方法用于比较对象是否相等,此处直接调用了父类object
的equals()
方法。tostring()
方法返回一个描述该对象内容的字符串,格式为"person{name='姓名', age=年龄}"
。
最终,我们需要根据 person
类的 name
字段对目标集合进行去重:
public static void main(string[] args) { list<person> persons = new arraylist<>(); persons.add(new person("tom", 20)); persons.add(new person("jerry", 18)); persons.add(new person("tom", 22)); persons.add(new person("jim", 23)); persons.add(new person("tom", 22)); persons.foreach(system.out::println); }
方法一:使用 hashset 数据结构
根据 java 对象某个字段进行去重,可以使用 hashset
数据结构。hashset
内部实现了哈希表,能够快速判断元素是否已存在,从而实现去重。
tips: hashset 是如何实现元素去重的,或者说如何判断元素是否重复?
在 java 中,hashset 是一种基于哈希表实现的集合类,它内部维护了一个存储元素的哈希表。hashset 通过元素的哈希码(hashcode)来判断元素是否重复的。
当我们向 hashset 中添加元素时,hashset 会首先计算该元素的哈希码,并根据哈希码将元素放入对应的桶中。如果该桶中已经有了相同哈希码的元素,则会调用元素的 equals() 方法,比较元素是否相等。如果相等,则认为该元素已经存在于 hashset 中,不进行重复添加;否则将该元素添加到集合中。
如果我们通过 hashset 进行去重,就需要正确地实现 hashcode() 和 equals() 方法。hashcode() 方法应该返回与元素属性相关的哈希码,而 equals() 方法应该根据元素属性判断元素是否相等。只有这样才能保证在 hashset 中正确地去重和查找元素。
使用 hashset
去重的具体步骤如下:
- 重写对象的
equals
和hashcode
方法。在这两个方法中,分别比较对象的指定字段,并返回相应的哈希值。 - 创建一个
hashset
对象,并将所有要去重的对象添加到该hashset
中。 - 遍历该
hashset
,处理去重后的结果。
重写 person
类的 equals
和 hashcode
方法,用于比较指定字段:
public class person { ...... // 重写 hashcode 方法 @override public int hashcode() { // 哈希值只与 name 字段有关 return name.hashcode(); } // 重写 equals 方法 @override public boolean equals(object o) { if (this == o) return true; if (o == null || getclass() != o.getclass()) return false; person person = (person) o; // 比较 name 字段 return name.equals(person.name); } }
在重写的 equals()
方法中,首先使用 this == o
来判断两个对象是否为同一个对象(即内存地址是否相同),如果是,则直接返回 true
。如果不是同一个对象,则继续比较其他属性。
接着,使用 o == null
判断传入的参数是否为 null
,如果是 null
,则两个对象肯定不相等,直接返回 false
。然后使用 getclass()
方法来获取传入对象的类,判断其是否与当前对象的类相同,如果不同,则两个对象肯定不相等,直接返回 false
。
最后,将参数对象强制转换成 person
类型,并比较两个对象的 name
属性是否相等。如果相等,则认为两个对象相等,返回 true
,否则返回 false
。
同时重写 hashcode()
方法,以确保两个对象相等时它们的哈希码也相等。
使用 hashset
去重:
public static void main(string[] args) { ...... hashset<person> personhashset = new hashset<>(persons); personhashset.foreach(system.out::println); }
去重结果为:
person{name='tom', age=20} person{name='jerry', age=18} person{name='jim', age=23}
方法二:使用 java 8 的 stream api 的 distinct() 去重
java 8 增加的 stream api 提供了 distinct()
方法去重。
stream 流的 distinct()
方法是基于对象的 equals()
方法来判断对象是否相等,因此我们需要重写 person
类的 equals()
方法:
public class person { ...... // 重写 equals 方法 @override public boolean equals(object o) { if (this == o) return true; if (o == null || getclass() != o.getclass()) return false; person person = (person) o; // 比较 name 字段 return name.equals(person.name); } }
之后调用 stream()
方法将列表转换为流,并且使用 distinct()
方法基于 name
字段进行去重:
list<person> collect = persons.stream() .distinct() .collect(collectors.tolist());
最后打印去重后的 person
集合:
person{name='tom', age=20} person{name='jerry', age=18} person{name='jim', age=23}
方法三:使用 map 数据结构
java 中的 map 是一种用于存储键值对的集合。我们可以利用 map 中的键唯一的特性实现去重。
我们只需要遍历 list 中的 person 对象,将 name 作为 key,person 对象作为 value 存入 map 中,这样就可以去除重复的 name 对应的 person 对象:
public static void main(string[] args) { ...... map<string, person> map = new hashmap<>(); for (person person : persons) { map.put(person.getname(), person); } }
去重结果如下:
person{name='tom', age=22} person{name='jerry', age=18} person{name='jim', age=23}
方法四:使用 collectors.tomap() 方法
collectors.tomap()
是 java 8 中的一个收集器(collector),它可以将 stream 中的元素收集到一个 map 中,其中每个元素都是一个键值对。该方法有多个重载形式:
tomap(function<? super t, ? extends k> keymapper, function<? super t, ? extends u> valuemapper)
将 stream 中的元素转换为键值对,并存储到一个map中。其中,keymapper
用于指定如何从元素中提取键,valuemapper
用于指定如何从元素中提取值。
如果存在重复的键,则会抛出illegalstateexception
异常。
tomap(function<? super t, ? extends k> keymapper, function<? super t, ? extends u> valuemapper, binaryoperator<u> mergefunction)
与第一种形式类似,但当存在重复的键时,会使用mergefunction
函数来处理冲突。例如,可以使用mergefunction
来选择较小或较大的值,或将两个值合并成一个新值。
tomap(function<? super t, ? extends k> keymapper, function<? super t, ? extends u> valuemapper, binaryoperator<u> mergefunction, supplier<m> mapsupplier)
与第二种形式类似,但允许指定用于创建 map 的具体实现类。
使用第二种重载形式将包含person
对象的list
转换为一个以person
对象的姓名作为键的map
:
public static void main(string[] args) { ...... map<string, person> collect = persons.stream() .collect(collectors.tomap(person::getname, p -> p, (p1, p2) -> p1)); }
person::getname
:函数式接口function
类型的方法引用,用于将person
对象的姓名作为键。person -> person
:lambda 表达式,用于将person
对象本身作为值。(p1, p2) -> p1
:lambda 表达式,用于处理当存在重复键时的情况。此处选择保留第一个键对应的值,而忽略第二个键对应的值。
去重结果如下:
person{name='tom', age=20} person{name='jerry', age=18} person{name='jim', age=23}
方法五:使用 collectors.collectingandthen() 方法
collectors.collectingandthen()
是 java 8 中的一个收集器(collector)方法,它允许在收集元素后应用一个最终转换函数。在使用collectingandthen()
时,先通过一个初始的收集器将元素收集起来,然后再应用一个最终转换函数对收集结果进行处理。
以下是collectingandthen()
方法的常用重载形式:
collectingandthen(collector<t, a, r> downstream, function<r, rr> finisher)
downstream
:初始的收集器,用于将元素收集起来并生成一个中间结果。finisher
:最终转换函数,用于对中间结果进行处理,并返回最终结果。
使用collectingandthen()
方法实现去重并返回去重后的结果集:
public static void main(string[] args) { ...... arraylist<person> collect = persons.stream() .collect(collectors.collectingandthen( collectors.tomap(person::getname, person -> person, (p1, p2) -> p1), map -> new arraylist<>(map.values()) )); }
- 使用
collectors.tomap()
将persons
流中的元素转换为一个以name
作为键的map
。 - 通过
map -> new arraylist<>(map.values())
将map
的值部分提取出来,并使用arraylist
的构造函数将其包装为一个新的arraylist<person>
对象。最终得到的arraylist<person>
对象即为去重后的结果集。
输出去重后的结果:
person{name='tom', age=20} person{name='jerry', age=18} person{name='jim', age=23}
以上就是java根据指定字段实现对对象进行去重的五种方法的详细内容,更多关于java指定字段对对象去重的资料请关注代码网其它相关文章!
发表评论