Cloudera Managerin asentaminen ja määrittäminen CentOS/RHEL 7:ssä - Osa 3


Tässä artikkelissa kuvasimme vaiheittaisen prosessin Cloudera Managerin asentamiseksi teollisuuden käytäntöjen mukaisesti. Osassa 2 olemme jo käyneet läpi Clouderan ennakkovaatimukset, varmista, että kaikki palvelimet on valmisteltu täydellisesti.

Vaatimukset

  • Parhaat käytännöt Hadoop-palvelimen käyttöönottoon CentOS/RHEL 7:ssä – Osa 1
  • Hadoopin ennakkovaatimusten määrittäminen ja suojauksen vahvistaminen – Osa 2

Tässä meillä on 5 solmuklusteri, jossa on 2 isäntä ja 3 työntekijää. Olen käyttänyt 5 AWS EC2 -esiintymää asennuksen osoittamiseen. Olen nimennyt nämä 5 palvelinta alla olevan mukaisesti.

master1.linux-console.net
master2.linux-console.net
worker1.linux-console.net
worker2.linux-console.net
worker3.linux-console.net

Cloudera Manager on hallinta- ja seurantatyökalu koko CDH:lle. Järjestelmänvalvoja kutsuu sitä yleensä Cloudera Hadoopin hallintatyökaluksi. Voimme ottaa käyttöön, valvoa, ohjata ja tehdä kokoonpanomuutoksia tämän työkalun avulla. Tämä on erittäin tärkeää koko klusterin hallinnassa.

Alla on Cloudera Managerin tärkeät käyttötarkoitukset.

  • Ota käyttöön ja määritä Hadoop-klusterit automaattisesti.
  • Seuraa klusterin kuntoa
  • Määritä hälytykset
  • Ongelmien karttoittaminen
  • Raportointi
  • Klusterin käyttöraportin tekeminen
  • Resurssien määrittäminen dynaamisesti

Vaihe 1: Apache-verkkopalvelimen asentaminen CentOS:ään

Aiomme käyttää master1 -palvelinta Cloudera-tietovarastojen verkkopalvelimena. Lisäksi Cloudera Manager on WebUI, joten Apache on oltava asennettuna. Asenna apache-verkkopalvelin noudattamalla alla olevia ohjeita.

yum -y install httpd

Kun httpd on asennettu, käynnistä se ja ota käyttöön, jotta se käynnistyy käynnistyksen yhteydessä.

systemctl start httpd
systemctl enable httpd

Kun olet käynnistänyt httpd, varmista tila.

systemctl status httpd

Kun olet käynnistänyt httpd:n, avaa selain paikallisessa järjestelmässäsi ja liitä master1:n IP-osoite hakupalkkiin. Sinun pitäisi saada tämä testisivu varmistaaksesi, että httpd toimii hyvin.

Vaihe 2: Määritä paikallinen DNS ratkaisemaan IP ja isäntänimi

Tarvitsemme DNS-palvelimen tai /etc/hosts-määrityksen IP-osoitteen ja isäntänimen selvittämiseksi. Tässä määritetään /etc/hosts, mutta reaaliajassa tuotantoympäristöä varten on olemassa oma DNS-palvelin.

Noudata alla olevia ohjeita tehdäksesi merkinnän kaikille palvelimillesi kansioon /etc/hosts.

vi /etc/hosts

Tämä tulee määrittää kaikissa palvelimissa.

13.235.27.144   master1.linux-console.net     master1
13.235.135.170  master2.linux-console.net     master2
15.206.167.94   worker1.linux-console.net     worker1
13.232.173.158  worker2.linux-console.net     worker2
65.0.182.222    worker3.linux-console.net     worker3

Vaihe 3: Määritä salasanaton SSH-kirjautuminen

Cloudera Manager asennetaan sovellukseen master1 tässä esittelyssä. Meidän on määritettävä salasanaton ssh tiedostosta master1 kaikkiin muihin solmuihin. Koska Cloudera Manager käyttää ssh-protokollaa viestiäkseen kaikkiin muihin solmuihin pakettien asentamista varten.

Noudata alla olevia ohjeita määrittääksesi salasanattoman ssh:n master1:sta kaikille jäljellä oleville palvelimille. Meillä on käyttäjä tecmint jatkaaksemme eteenpäin.

Luo käyttäjä tecmint kaikille 4 palvelimelle käyttämällä useradd-komentoa kuvan mukaisesti.

useradd -m tecmint

Myönnä pääkäyttäjän oikeudet tecmint-käyttäjälle lisäämällä alla oleva rivi /etc/sudoers-tiedostoon. Voit lisätä tämän rivin rootin alle kuvakaappauksen mukaisesti.

tecmint   ALL=(ALL)    ALL

Vaihda käyttäjäksi tecmint ja luo ssh-avain master1-kenttään käyttämällä alla olevaa komentoa.

sudo su tecmint
ssh-keygen

Kopioi nyt luotu avain kaikkiin neljään palvelimeen käyttämällä ssh-copy-id-komentoa kuvan mukaisesti.

ssh-copy-id -i ~/.ssh/id_rsa.pub [email 
ssh-copy-id -i ~/.ssh/id_rsa.pub [email 
ssh-copy-id -i ~/.ssh/id_rsa.pub [email  
ssh-copy-id -i ~/.ssh/id_rsa.pub [email 

Nyt sinun pitäisi pystyä lähettämään ssh:sta master1-palvelimesta kaikille muille palvelimille ilman salasanaa kuvan osoittamalla tavalla.

ssh master2
ssh worker1
ssh worker2
ssh worker3

Vaihe 4: Cloudera Managerin asentaminen ja määrittäminen

Voimme käyttää toimittajan (Cloudera) -varastoa asentamaan kaikki paketit RHEL/CentOS:n paketinhallintatyökalujen avulla. Reaaliajassa oman arkiston luominen on paras käytäntö, koska meillä ei välttämättä ole Internet-yhteyttä tuotantopalvelimissa.

Täällä asennamme Cloudera Manager 6.3.1 -julkaisun. Koska aiomme käyttää master1 -palvelinta repopalvelimena, lataamme paketit alla mainitulla polulla.

Luo alla mainitut hakemistot master1-palvelimelle.

sudo mkdir -p /var/www/html/cloudera-repos/cm6

Voimme käyttää wget-työkalua pakettien lataamiseen http:n kautta. Joten asenna wget käyttämällä alla olevaa komentoa.

sudo yum -y install wget

Lataa seuraavaksi Cloudera Manager tar -tiedosto käyttämällä seuraavaa wget-komentoa.

wget https://archive.cloudera.com/cm6/6.3.1/repo-as-tarball/cm6.3.1-redhat7.tar.gz

Pura tar-tiedosto hakemistoon /var/www/html/cloudera-repos/cm6, olemme jo tehneet master1:stä verkkopalvelimeksi asentamalla http ja olemme testanneet selaimella.

sudo tar xvfz cm6.3.1-redhat7.tar.gz -C /var/www/html/cloudera-repos/cm6 --strip-components=1

Varmista nyt, että kaikki Clouderan rpm-tiedostot ovat /var/www/html/cloudera-repos/cm6/RPMS/x86_64-hakemistossa.

cd /var/www/html/cloudera-repos/cm6
ll

Luo /etc/yum.repos.d/cloudera-manager.repo-tiedostoja kaikille klusterin isäntien palvelimille, joissa on seuraava sisältö. Tässä master1 (65.0.101.148) on Web-palvelinta.

[cloudera-repo]
name=cloudera-manager
baseurl=http:///cloudera-repos/cm6/
enabled=1
gpgcheck=0

Nyt arkisto on lisätty, suorita alla oleva komento nähdäksesi käytössä olevat arkistot.

yum repolist

Suorita alla oleva komento nähdäksesi kaikki käytettävissä olevat Clouderaan liittyvät paketit arkistossa.

yum list available | grep cloudera*

Asenna cloudera-manager-server, cloudera-manager-agent, cloudera-manager-daemons cloudera-manager-server-db-2.

sudo yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server cloudera-manager-server-db-2

Suorita alla oleva komento nähdäksesi kaikki asennetut Cloudera-paketit.

yum list installed | grep cloudera*

Suorita alla oleva komento käynnistääksesi cloudera-scm-server-db, joka on taustalla oleva tietokanta Cloudera Managerin ja muiden palveluiden metatietojen tallentamiseen.

Oletusarvoisesti Cloudera on tulossa postgre-sql:lle, joka on upotettu Cloudera Manageriin. Asennamme sulautetun, reaaliaikaiseen ulkoiseen tietokantaan, jota voidaan käyttää. Se voi olla Oracle, MySQL tai PostgreSQL.

sudo systemctl start cloudera-scm-server-db

Suorita alla oleva komento tarkistaaksesi tietokannan tilan.

sudo systemctl status cloudera-scm-server-db

Määritä db.properties Cloudera Manager -palvelimelle.

vi /etc/cloudera-scm-server/db.properties

Määritä alla oleva arvo EMBEDDED, jotta Cloudera Manager käyttää Upotettua tietokantaa.

com.cloudera.cmf.db.setupType=EMBEDDED

Käynnistä Cloudera Manager -palvelin suorittamalla alla oleva komento.

sudo systemctl start cloudera-scm-server

Suorita alla oleva komento tarkistaaksesi Cloudera Manager -palvelimen tilan.

sudo systemctl status cloudera-scm-server

Suorita alla oleva komento käynnistääksesi ja tarkistaaksesi Cloudera Manager -agentin tilan.

sudo systemctl start cloudera-scm-agent
sudo systemctl status cloudera-scm-agent

Kun Cloudera Manager Server on onnistunut ja toimii hyvin, voit tarkastella WebUI:ta (kirjautumissivua) selaimessa käyttämällä IP-osoitetta ja porttinumeroa 7180, joka on portin numero. Cloudera Manager.

https://65.0.101.148:7180

Yhteenveto

Tässä artikkelissa olemme nähneet vaiheittaiset prosessit Cloudera Managerin asentamiseen CentOS 7 -käyttöjärjestelmään. Näemme CDH- ja muut palveluasennukset seuraavassa artikkelissa.