前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住给大家分享一下。点击跳转到网站:https://www.captainai.net/dongkelun
前言
因添加列在平时可能会经常用到,但是长时间不用,可能会忘记应该用哪个函数,这样再重新查找比较耽误时间,于是总结代码进行备忘。主要总结:
- 根据现有的列添加
- 添加自增ID
- 添加一列常量
- 添加当前时间
- 转换为timestamp类型
- 转换为date类型
代码
1 | package com.dkl.blog.spark.df |
运行结果
1 | |-- id: long (nullable = false) |
UDF
也可以使用自定义函数添加新列,具体可以参考Spark UDF使用详解及代码示例,各自的优劣可以自己总结