2023-09-20发表2023-09-20更新技术 / ftp3 分钟读完 (大约504个字)

FTP服务介绍

记录下一些ftp服务器相关内容，默认使用vsftpd作为服务使用

2021-05-30发表2025-04-15更新技术 / python / jupyter2 分钟读完 (大约331个字)

Jupyter做数据分析常用脚本

本文介绍jupyter中分析基础数据常用的一些工具和指令

2020-08-14发表2020-08-21更新技术 / icecast9 分钟读完 (大约1346个字)

音频直播Icecast服务器以及liquidsoap推流

icecast是一个音频直播流媒体服务器，支持Ogg(Vorbis和Theora)，Opus，WebM和MP3流。他可以被用来创建网络电台。
官方网站
 Gitlab源码地址

Icecast本身只是个直播服务器，一般使用方式是使用推流客户端（例如IceS，liquidsoap等）推流到icecast server，然后用户从icecast收听。

2020-07-01发表2020-08-21更新技术 / elasticsearch11 分钟读完 (大约1672个字)

Elasticseasrch简介

Elasticsearch相关

Elasticsearch和Mysql中概念对比

Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Index -> Types -> Documents -> Fields
mysql和es对比

2020-01-02发表2020-01-02更新技术 / kafka7 分钟读完 (大约1026个字)

kafka备份方案

备份方案

使用两个kafka connectors，一个sink connector向外部数据源（S3、ES、Hive）导出数据，一个source connector从外部源恢复数据
使用connect同步数据到s3，然后清除60天以前的数据，可以达到备份+归档且释放硬盘空间的目的

2019-10-29发表2020-08-21更新技术 / shell1 分钟读完 (大约224个字)

常用shell

日志分组计数并排序

1	grep 'crawler_news_insert' stderr.log.2020-01-29-12 \| awk '{print $2}' \| awk -F':' '{cnt[$2]+=1}END{for(c in cnt){print c,cnt[c]}}' \| sort -n -k 1

解除linux用户过期时间

1	chage -l li

nc传输文件

内网环境下可以使用nc来传输文件，使用内网带宽

在机器B开启端口监听，收取文件

1	nc -l 9999 > xxxx.zip

机器A发送文件，指定收取端(服务器端)的ip和端口

1	nc 192.168.1.3 9999 < xxxx.zip

复杂awk分词计数

# 
# 分离出每个接口每秒的请求次数、平均请求时间
grep "T07:30:" access_www.more.buzz.log access_www.morenews1.com.log | awk '{split($4, t, ":");split($6, a, "?");cnt[t[2]":"t[3]"\t"a[1]]+=1;times[t[2]":"t[3]"\t"a[1]]+=$NF}END{for(c in cnt){print c"\t"cnt[c]"\t"times[c]"\t"times[c]/cnt[c]}}'

# 时间正则匹配，统计大于10s的请求
grep '2020-05-22 11:11:[45]' access.log | awk '{if ($8 > 10000) { cnt[$5] += 1}}END{for(c in cnt){print c,cnt[c]}}'

2019-10-24发表2019-10-24更新技术 / 采坑记录5 分钟读完 (大约740个字)

SpringBoot项目获取客户端IP

本文主要介绍了SpringBoot项目中如何获取真实客户端IP，在应用前侧有nginx或cdn时应该如何处理。

X-Forwarded-For(简称XFF)是一个常见的(非正式使用的)传递真实用户IP的方式，其内容一般是：

1	X-Forwarded-For: real_client_ip, proxy1_ip, proxy2_ip

真实用户IP会被放在第一位

2019-10-12发表2020-07-27更新技术 / shell几秒读完 (大约96个字)

Linux查看CPU信息

总核数 = 物理CPU个数 X 每颗物理CPU的核数
总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数

# 查看物理CPU个数
cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l

# 查看每个物理CPU中core的个数(即核数)
cat /proc/cpuinfo| grep "cpu cores"| uniq

# 查看逻辑CPU的个数
cat /proc/cpuinfo| grep "processor"| wc -l

2019-09-19发表2020-01-20更新技术 / kafka1 分钟读完 (大约177个字)

KafkaManager安装启动流程

安装脚本

# 安装jdk
yum install -y jdk8

JAVA_HOME="/home/jdk1.8.0"
PATH=$PATH:$JAVA_HOME/bin

export JAVA_HOME PATH

# 下载kafka-manager
wget https://github.com/yahoo/kafka-manager/archive/2.0.0.2.tar.gz
mkdir kafka-manager
tar -xzvf 2.0.0.2.tar.gz -C ./kafka-manager --strip-components 1

# 安装sbt
curl https://bintray.com/sbt/rpm/rpm > bintray-sbt-rpm.repo
mv bintray-sbt-rpm.repo /etc/yum.repos.d/
yum install sbt -y

# make
cd kafka-manager
./sbt clean dist
cp target/universial/kafka-manager-2.0.0.2.zip /home/
cd /home
unzip kafka-manager-2.0.0.2.zip
cd kafka-manager-2.0.0.2

# 修改kafka-manager的链接信息
sed -i "s/kafka\-manager\-zookeeper:2181/common1-t1.zookeeper.s.news:2181/" conf/application.conf

启动脚本

KAFKA_MANAGER_USERNAME="admin"
KAFKA_MANAGER_PASSWORD="admin"
JAVA_HOME=/home/jdk1.8.0
PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin:/usr/jdk1.8.0/bin
export JAVA_HOME PATH
nohup bin/kafka-manager -Dconfig.file=conf/application.conf -Dhttp.port=8888 > kafka-manager.log 2>&1 &

2019-09-12发表2020-01-02更新技术 / kafka3 分钟读完 (大约484个字)

Kafka简介

简单介绍下Kafka相关内容，大部分内容摘自网络

Elasticsearch相关

Elasticsearch和Mysql中概念对比

备份方案

日志分组计数并排序

解除linux用户过期时间

nc传输文件

复杂awk分词计数

安装脚本

启动脚本

链接

分类

最新文章

归档

标签

广告