悠悠楠杉
网站页面
标题:HDFS在CentOS上的详细安装与配置指南
关键词:HDFS安装、CentOS配置、Hadoop分布式存储、大数据环境搭建
描述:本文详细介绍在CentOS 7/8系统上安装和配置HDFS(Hadoop分布式文件系统)的完整步骤,包括环境准备、Java安装、Hadoop配置及启动测试,适合大数据初学者快速部署分布式存储环境。
正文:
在开始安装HDFS前,需确保CentOS系统满足以下条件:
1. 操作系统:CentOS 7或8(本文以CentOS 7为例);
2. 硬件要求:至少2核CPU、4GB内存、50GB磁盘空间;
3. 网络配置:所有节点需在同一局域网内,且主机名和IP地址已正确配置。
为避免网络通信问题,需临时关闭防火墙和SELinux:
sudo systemctl stop firewalld
sudo systemctl disable firewalld
sudo setenforce 0
sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
HDFS依赖Java运行环境,推荐安装OpenJDK 8:
sudo yum install -y java-1.8.0-openjdk-devel
java -version # 验证安装
从Apache官网下载Hadoop 3.x版本(以3.3.6为例):
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
tar -xzvf hadoop-3.3.6.tar.gz -C /opt/
sudo mv /opt/hadoop-3.3.6 /opt/hadoop
编辑/etc/profile文件,添加以下内容:
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
执行source /etc/profile使配置生效。
进入/opt/hadoop/etc/hadoop目录,编辑以下文件:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value> <!-- 单节点设为1 -->
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/opt/hadoop_data/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/opt/hadoop_data/datanode</value>
</property>
</configuration>
sudo mkdir -p /opt/hadoop_data/{namenode,datanode}
sudo chown -R $USER:$USER /opt/hadoop_data
首次启动需格式化:
hdfs namenode -format
start-dfs.sh
jps # 检查NameNode、DataNode是否运行
浏览器输入http://<服务器IP>:9870,即可查看HDFS管理界面。
core-site.xml中的端口号。/opt/hadoop/logs/下的错误信息。通过以上步骤,您已成功在CentOS上部署了HDFS。接下来可进一步配置YARN或MapReduce,构建完整的大数据生态。