前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住给大家分享一下。点击跳转到网站:https://www.captainai.net/dongkelun
前言
总结如何使用Spark DataFrame isin 方法
需求
查询DataFrame某列在某些值里面的内容,等于SQL IN ,如 where year in(‘2017’,’2018’)
代码示例
1 | package com.dkl.blog.spark.df |
结果1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22+---+----+---+-----+
| id|name|age| year|
+---+----+---+-----+
|001| 张三| 21| 2018|
|002| 李四| 18| 2017|
|003| sam| 18| 2019|
|004|abby| 23|20117|
+---+----+---+-----+
+---+----+---+----+
| id|name|age|year|
+---+----+---+----+
|001| 张三| 21|2018|
|002| 李四| 18|2017|
+---+----+---+----+
| id|name|age|year|
+---+----+---+----+
|001| 张三| 21|2018|
|002| 李四| 18|2017|
+---+----+---+----+