TDSQL集群扩容DB节点

发布时间 2023-12-23 18:42:46作者: chy_cug

具体步骤见百度云盘:https://pan.baidu.com/s/1zMrjhckI2I4O1G1RzC09uQ 提取码:h5mm。本文档适用于TDSQL(MYSQL版)和TDSQL(PG版)。内容如下:

一、以下步骤在新增机器上面执行:
1、检查audit服务(Mysql版本特有):
systemctl status auditd,
#如果存活则关闭:systemctl stop auditd && systemctl disable auditd &&auditctl -e 0
2、检查sssd服务(Mysql版本特有):
systemctl status sssd ##systemctl stop sssd && systemctl disable sssd
3、时间同步: ---查看机器中是否已经配置时间同步 yes
(ntpstat 2>/dev/null|grep -iw synchronised 2>&1 >/dev/null&& echo yes)|| (chronyc sources -v 2>/dev/null|grep 'Name/IP' 2>&1 >/dev/null && echo yes)
4、yum源:
yum repolist
cat /etc/yum.repos.d/rhel.repo
5、操作系统版本及内核版本: ---查看操作系统和内核版本是否和源集群一致 与ansible机器比较
nkvers
uname -r
6、防火墙确认关闭:
##f确认firwalld,selinux均已关闭
cat /etc/sysconfig/selinux|grep -i 'SELINUX'
systemctl status firewalld
getenforce
7、磁盘挂载:
df –h
#确认/data,/data1均添加开机自启动。且/data,/data1使用xfs格式挂载
cat /etc/fstab
8、fio性能测试:
#测试完成后需要删除fiotest.db文件
#data1目录
fio --filename=/data1/fiotest.db --direct=1 --rw=randrw --rwmixwrite=70 --ioengine=libaio --bs=16k --size=5G --numjobs=10 --runtime=60 --group_reporting --name=mytest --iodepth=16
#data目录
fio --filename=/data/fiotest.db --direct=1 --rw=randrw --rwmixwrite=70 --ioengine=libaio --bs=16k --size=5G --numjobs=10 --runtime=60 --group_reporting --name=mytest --iodepth=16
9、机器规格确认: ---确认机器CPU、内存,磁盘,查看是否跟集群中其他机器一样,如一样。后续上报可用同个机型上报,如不一样,则新建机型上报 与ansible比较
#内存
free -g
#CPU
lscpu
#磁盘
df -h
10、precheck检查:
#OS - glibc版本 >=2.17
rpm -qa|egrep 'glibc-[0-9]'|cut -d '-' -f 2 | head -1
#主机名验证 =yes
if [[ ! $HOSTNAME =~ localhost ]]; then echo yes; else echo no; fi
#OS - 语言(locale language) 与原来机器保持一致
localectl status | grep 'System Locale' | cut -d= -f2
#CPU MHz 与其他机器一致
dmidecode | grep -A30 CPU | grep -i speed
#性能模式
#IO调度策略 =nothing
diskname=$(lsblk -o name,fstype,rota,type,sched,state|grep -v 'rom'|grep -E '^[a-z]'|egrep -v 'mq-deadline|none' || echo '');if [[ -z $diskname ]]; then echo 'nothing'; else echo $diskname |awk '{print $1}'; fi;
#numa =1或与其他机器一致
lscpu |grep NUMA|grep -v CPU|awk '{print $3}'
#透明大页 = never
cat /sys/kernel/mm/transparent_hugepage/enabled | sed -r 's/.*\[(.*)\].*/\1/'
#性能模式检查 =performance
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
二、以下步骤在主控机上面执行:
1、ssh免密交互: ---此处不不需要生成密钥
主控机1上:
ssh-copy-id -i ~/.ssh/id_rsa.pub root@10.25.40.151
ssh-copy-id -i ~/.ssh/id_rsa.pub root@10.25.40.152
主控机2上:
ssh-copy-id -i ~/.ssh/id_rsa.pub root@10.25.40.133
ssh-copy-id -i ~/.ssh/id_rsa.pub root@10.25.40.134
ssh-copy-id -i ~/.ssh/id_rsa.pub root@10.25.40.135
ssh-copy-id -i ~/.ssh/id_rsa.pub root@10.25.40.136
2、扩容DB:
cd tdsql_install/playbooks
vim tdsql_newdb.yml
- name: install db beginning
hosts: tdsql_newdb
remote_user: root
gather_facts: false
roles:
- tdsql_beginning

- name: install db_module server
hosts: tdsql_newdb
remote_user: root
gather_facts: false
roles:
- tdsql_db_module

- name: hdfs config on newdb
hosts: tdsql_newdb
remote_user: root
gather_facts: false
roles:
- tdsql_hdfs_conf
tags: hdfs_conf
3、修改tdsql_hosts:
主控机1上:
cd tdsql_install/
vim tdsql_hosts
[tdsql_newdb]
tdsql_newdb1 ansible_ssh_host=10.21.17.151
主控机2上:
cd tdsql_install/
vim tdsql_hosts
[tdsql_newdb]
tdsql_newdb1 ansible_ssh_host=10.21.17.152
4、执行db安装:
ansible-playbook -i tdsql_hosts playbooks/tdsql_newdb.yml
三、赤兔前台:
1、前台上报资源: ---CPU、内存、磁盘等如果与集群中原有的机器不一致,则需要新建机型
【资源管理】>【设备资源】>【上报设备资源】