前言
如题,记录在Spark ML LR中如何解决数据不平衡。参考:Dealing with unbalanced datasets in Spark MLlib
1、数据不平衡
指label == 1和label == 0 的数据比例的很多,如80%和20%,这样导致模型的结果的准确率也不平衡,不准确。
如题,记录在Spark ML LR中如何解决数据不平衡。参考:Dealing with unbalanced datasets in Spark MLlib
指label == 1和label == 0 的数据比例的很多,如80%和20%,这样导致模型的结果的准确率也不平衡,不准确。
Run workloads 100x faster.
将工作负载运行速度提高100倍。
记录一个异常
Spark读取CSV文件,文件里的某些内容编码格式有问题或者有特殊字符
一种情况是 62,我碰到的这种,另一种是63,查资料查的1
java.lang.ArrayIndexOutOfBoundsException:62
1 | java.lang.ArrayIndexOutOfBoundsException:63 |
如题,本文总结Oracle和MySQL如何判断是否为空或NULL
1 | CREATE TABLE TEST_NULL ( |
1 | INSERT INTO TEST_NULL (ID, NAME) VALUES('001', '张三'); |
本文总结MySQL和Oracle的字符串截取函数的用法
工作中MySQL和Oracle都用,有时会碰到两种数据库SQL用法的不同,就会上网查一下,但是时间久了,就忘记了,好记性不如烂笔头,所以写个笔记备忘一下~
函数:SUBSTRING 或 SUBSTR
位置1
2SUBSTRING(string,position);
SUBSTRING(string FROM position);
位置和长度1
2SUBSTRING(string,position,length);
SUBSTRING(string FROM position FOR length);
- | H | e | l | l | 0 | W | o | r | l | d | |
---|---|---|---|---|---|---|---|---|---|---|---|
正数 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
负数 | -11 | -10 | -9 | -8 | -7 | -6 | -5 | -4 | -3 | -2 | -1 |
tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true