admin 发布的文章
centos中使用docker安装微信
sudo docker run -d --name wechat --device /dev/snd --ipc="host" \
-v /tmp/.X11-unix:/tmp/.X11-unix \
-v $HOME/WeChatFiles:/WeChatFiles \
-e DISPLAY=unix$DISPLAY \
-e XMODIFIERS=@im=ibus \
-e QT_IM_MODULE=ibus \
-e GTK_IM_MODULE=ibus \
-e AUDIO_GID=`getent group audio | cut -d: -f3` \
-e GID=`id -g` \
-e UID=`id -u` \
bestwu/wechat
source wechat.sh
docker start wechat
docker stop wechat
sudo docker rm -f wechat
http://shiyuefei.top/2020/09/01/CentOS%E5%AE%89%E8%A3%85%E5%BE%AE%E4%BF%A1/
https://www.jianshu.com/p/2a603db77195
https://zhuanlan.zhihu.com/p/379416038
https://zhuanlan.zhihu.com/p/323723229
https://www.jianshu.com/p/2a603db77195
hive列转行
SELECT
upc_y,
standard_id
FROM
table lateral VIEW explode(split(upc, ';')) t1 AS upc_y
注意这里对特殊字符要进行转义: '#\$%#' ';'
(1)有的符号是特殊字符,有的不是
'''
select
sku_name
sku_name_cleans,
from aa
lateral VIEW explode(split(sku_name, '#\\\$%#')) t1 AS sku_name_cleans
where
dt='2021-08-04'
'''
贝叶斯算法
一、基本概念
1.分类原理
通过某对象的先验概率,利用贝叶斯公式,计算出其后验概率。即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。
2.贝叶斯公式
$$P(A|B) = \frac{P(B|A)*P(A)}{P(B)}$$
- (1).其中P(A)为先验概率:先验概率(prior probability)是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现的概率。;
- (2).其中P(B|A)为似然概率(likelihood),条件概率:是先前统计的事件中,A事件发生情况下B事件发生的概率
- (3).其中P(B)为边界似然概率;
- (4).其中P(A|B)为后验概率;
3.相关概念
- (1).先验概率:是指根据以往经验和分析得到的概率
(2).----
- ①后验概率:后验概率是指通过调查或其它方式获取新的附加信息,利用贝叶斯公式对先验概率进行修正,而后得到的概率
- ②.最大后验概率:
(3).---
- ①.条件概率:指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为:P(A|B)。若只有两个事件A,B,那么$P(A|B) = \frac{P(AB)}{P(B)}$
- ②.联合概率:表示两个事件共同发生的概率。A与B的联合概率表示为 P(AB) 或者P(A,B),或者P(A∩B)
- ③.全概率
- (4).似然概率
联合概率的乘法公式为:P(AB) = P(A|B)*P(B),变形后可得到$P(A|B) = \frac{P(AB)}{P(B)}$
二、朴素贝叶斯分类器
1.朴素贝叶斯分类的定义
朴素贝叶斯分类的正式定义如下:
(1).设 $x = \left\{ f_{1},f_{2},f_{3},...,f_{m} \right\}$为一个待分类项,而每个f为x的一个特征。
(2).有类别集合$C = \left\{ y_{1},y_{2},y_{3},...,y_{n} \right\}$
(3).计算$P(y_{1}|x),P(y_{2}|x),....,P(y_{n}|x)$
(4).如果$P(y_{k}|x) = max \left\{ P(y_{1}|x),P(y_{2}|x),....,P(y_{n}|x) \right\},则x∈y_{k}$。
那么现在的关键就是如何计算第3步中的各个条件概率。我们可以这么做:
(1)、找到一个已知分类的待分类项集合,这个集合叫做训练样本集。
(2)、统计得到在各类别下各个特征属性的条件概率估计。即
$P(x_{1}|y_{1}),P(x_{2}|y_{1}),...,P(x_{3}|y_{1})$;
$P(x_{1}|y_{2}),P(x_{2}|y_{2}),...,P(x_{3}|y_{2})$;
......
$P(x_{1}|y_{3}),P(x_{2}|y_{3}),...,P(x_{3}|y_{3})$;
(3)、如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导:
$P(y_{i}|x) = \frac {P(x|y_{i})P(y_{i})}{P(x)}$
因为分母对于所有类别为常数,因为我们只要将分子最大化皆可。又因为各特征属性是条件独立的,所以有:
$P(x|y_{i})P(y_{i}) = P(a_{1}|y_{i})P(a_{2}|y_{i})...P(a_{m}|y_{i})P(y_{i})=P(y_(i))\prod\limits_{j=1}^mP(a_j|yi)$
2.朴素贝叶斯分类的举例
我们知道朴素贝叶斯的公式为:
$P(C|f) = \frac{P(f|C)*P(C)}{P(f)}$
如果换个表达式就会明朗很多,如下:
$P(类别|特征) = \frac{P(特征|分类)*P(分类)}{P(特征)}$
其中P(分类)和P(特征)都是已知的,我们只需求P(特征|分类)即可。
例题分析
给定数据如下:
高否 | 富否 | 帅否 | 嫁否 |
---|---|---|---|
高 | 富 | 帅 | 嫁 |
高 | 不富 | 帅 | 嫁 |
不高 | 富 | 不帅 | 嫁 |
高 | 富 | 不帅 | 不嫁 |
不高 | 不富 | 帅 | 不嫁 |
高 | 不富 | 不帅 | 不嫁 |
不高 | 不富 | 不帅 | 不嫁 |
那我们现在的问题是,一个男生向一个女生求婚,这个男生具有以下三个特点:不高、富、帅,请你判断以下该女孩是否会嫁?
这是一个典型的分类问题,转化为概率论问题就是$P(嫁|不高、富、帅)$ 与 $P(不嫁|不高、富、帅)那个概率更大?
这里我们就使用朴素贝叶斯公式来分别求以下两种情况下的概率:
- ①$P(嫁|不高、富、帅) = \frac {P(不高、富、帅|嫁)*P(嫁)}{P(不高、富、帅)}$
- ②$P(不嫁|不高、富、帅) = \frac {P(不高、富、帅|不嫁)*P(不嫁)}{P(不高、富、帅)}$
对①求解
我们先对要求①进行求解。要求$P(嫁|不高、富、帅)$的概率只需求$P(不高、富、帅|嫁)、P(嫁)、P(不高、富、帅)$即可。根据“朴素”一词也就是各个特征之间是独立的,可以得到如下<1>公式和<2>公式(只需求如下公式即可):
<1>$P(不高、富、帅|嫁) = P(不高|嫁)*P(富|嫁)*P(帅|嫁)$
<2>$P(不高、富、帅) = P(不高)*P(富)*P(帅)$
同时只需要再求出公式<3>问题就得到解决
<3>$P(嫁)$
我们从表格中统计所有嫁的样本共有3条,其中不高的样本有1条,所以$P(不高|嫁) = 1/3$,同理可以得到$P(富|嫁) = 2/3$, $P(帅|嫁) = 2/3$。
我们从表格中统计所有样本共有7条,其中嫁的样本有3条,所以 $P(嫁) = 3/7$。
我们从表格中统计所有样本共有7条,其中不高的样本有3条,所以 $P(不高) = 3/7$,其中富的样本有3条所以$P(富) = 3/7$,其中帅的样本有3条所以$P(帅) = 3/7$。
综上①$P(嫁|不高、富、帅) = \frac {P(不高、富、帅|嫁)*P(嫁)}{ \; P(不高、富、帅) \; } $
此公式 $= \frac {(\frac {1}{3} *\frac {2}{3}*\frac {2}{3})*\frac {3}{7}} {\frac {3}{7} *\frac {3}{7}*\frac {3}{7}} =\frac {196}{243}$
d对②求解
$P(不嫁|不高、富、帅) = \frac {P(不高、富、帅|不嫁)*P(不嫁)}{P(不高、富、帅)}$
此公式 $= \frac {(\frac {1}{2} *\frac {1}{4}*\frac {1}{4})*\frac {4}{7}} {\frac {3}{7} *\frac {3}{7}*\frac {3}{7}} =\frac {49}{216}$
所以最终的答案是“嫁”
参考:
1.https://blog.csdn.net/xueyingxue001/article/details/52396170
2.https://blog.csdn.net/amds123/article/details/70173402
空调参数选择
一、定频&变频
1.先说定频空调
定频空调的功率是固定的,开启后以固定功率工作。
比如你1500W功率,那就一直以1500W功率运行,外机达到设定温度后会停机,感温器感知室内温度变化后外机启动运行,如此反复不断。
这里有一些问题,室内温度变化到外机再启动中间会有时间差,导致用户会感觉忽冷忽热;同时外机频繁启停也是定频空调更费电的原因;有一些用户睡觉比较轻,外机频繁启停对睡眠质量影响很大。。
2.接着说变频空调
变频空调相比定频多了一个变频器,外机工作时它的功率可以不断变化,所以除了额定功率,变频空调多了变频功率。
以1.5P变频空调举例,它的额定功率一般是1000W,变频功率会在100w-1500w左右,开机后变频器会迅速进入最大频率,这样空调以1500W功率运行,可以很快达到设定温度。
达到设定温度后空调会以一个低功率运转,这个可能是100w,也可能是200w、300w、400w,只要产出的制冷量可以保持在你设定的温度就可以了,这种低功率一方面是省电,另一方面是噪音低。
从上述工作原理,可以看出变频空调性能更好,它的制冷速度快、恒温性能好、噪音低,使用舒适性非常好,而且相比定频更节能。
二、重点功能
1.清洗功能
有这个功能的机型,空调内机可以自动清除灰尘,解决用户清洗空调内机的麻烦。
2.扫风方式
入门的空调多是上下摆风,中高端产品会有左右摆风,左右摆风实际使用中对人非常友好,但价格也高,按需选择。
3.除湿功能
南方用户一定要注意这个功能,解决梅雨季潮湿和冬季湿冷非常实用。
空调本身的制冷就有一定的除湿作用,但对于梅雨季和冬季湿冷来说并不适用,带有除湿功能的机型相当于一台除湿机使用,除湿效率也不错。
4.能效等级
1.等级
等级1表示产品节电已达到国际先进水平,能耗最低;等级2表示产品比较节电;等级3表示产品能源效率为我国市场的平均水平;等级4表示产品能源效率低于市场平均水平;等级5是产品市场准入指标,低于该等级要求的产品不允许生产和销售。
2.能源消耗效率
APF: 旧国际一级能效 4.50 ;新国际一级能效 5.0