Cloudera Managerin asentaminen ja määrittäminen CentOS/RHEL 7 -sovellukseen - osa 3


Tässä artikkelissa kuvasimme askel askeleelta prosessin Cloudera Managerin asentamiseksi teollisten käytäntöjen mukaisesti. Osassa 2 olemme jo käyneet läpi Cloudera-ennakkoedellytykset. Varmista, että kaikki palvelimet ovat valmistautuneet täydellisesti.

  • Hadoop-palvelimen käyttöönoton parhaat käytännöt CentOS/RHEL 7: ssä - osa 1
  • Hadoopin ennakkoedellytysten asettaminen ja turvallisuuden kovettaminen - osa 2

Täällä meillä on 5 solmujoukkoa, jossa 2 päällikötä ja 3 työntekijää. Olen käyttänyt 5 AWS EC2 -instanssia asennuksen osoittamiseen. Olen nimittänyt nämä 5 palvelinta alla.

master1.linux-console.net
master2.linux-console.net
worker1.linux-console.net
worker2.linux-console.net
worker3.linux-console.net

Cloudera Manager on koko CDH: n hallinto- ja valvontatyökalu. Järjestelmänvalvoja kutsuu sitä yleensä Cloudera Hadoopin hallintatyökaluksi. Voimme ottaa käyttöön, seurata, hallita ja tehdä kokoonpanomuutoksia tämän työkalun avulla. Tämä on erittäin tärkeää koko klusterin hallitsemiseksi.

Alla on Cloudera Managerin tärkeät käyttötavat.

  • Ota Hadoop-klusterit käyttöön ja määritä ne automatisoidusti.
  • Seuraa klusterin kuntoa
  • Määritä hälytykset
  • vianetsintä
  • Raportointi
  • Klusterin käyttöraportin tekeminen
  • Resurssien määrittäminen dynaamisesti

Vaihe 1: Asenna Apache-verkkopalvelin CentOSiin

Aiomme käyttää master1 -palvelinta Cloudera-arkistojen verkkopalvelimena. Lisäksi Cloudera Manager on WebUI, joten meidän on asennettava Apache. Asenna apache-verkkopalvelin noudattamalla seuraavia ohjeita.

# yum -y install httpd

Kun olet asentanut httpd, käynnistä se ja ota käyttöön, jotta se käynnistetään käynnistettäessä.

# systemctl start httpd
# systemctl enable httpd

Kun olet aloittanut httpd, varmista tila.

# systemctl status httpd

Kun olet aloittanut httpd: n, avaa selain paikallisessa järjestelmässäsi ja liitä master1 -palvelun IP-osoite hakupalkkiin. Hanki tämä testisivu varmistaaksesi, että httpd toimii oikein.

Vaihe 2: Määritä paikallinen DNS ratkaisemaan IP ja isäntänimi

Meillä on oltava DNS-palvelin tai määritettävä/etc/hosts ratkaisemaan IP ja isäntänimi. Tässä määritämme/etc/hosts, mutta reaaliajassa erillinen DNS-palvelin on siellä tuotantoympäristössä.

Seuraa alla olevia ohjeita tehdessäsi merkinnän kaikille palvelimillesi/etc/hosts.

# vi /etc/hosts

Tämä on määritettävä kaikissa palvelimissa.

13.235.27.144   master1.linux-console.net     master1
13.235.135.170  master2.linux-console.net     master2
15.206.167.94   worker1.linux-console.net     worker1
13.232.173.158  worker2.linux-console.net     worker2
65.0.182.222    worker3.linux-console.net     worker3

Vaihe 3: Määritä SSH Passwordless Login

Cloudera Manager on asennettuna master1 -ohjelmaan tässä esittelyssä. Meidän on määritettävä ilman salasanaa ssh master1 -kohdasta kaikkiin muihin solmuihin. Koska Cloudera Manager käyttää ssh: tä kommunikoimaan kaikki muut solmut pakettien asentamiseksi.

Seuraa alla olevia ohjeita määrittääksesi salasanattomia ssh-tiedostoja master1 -kohdasta kaikkiin jäljellä oleviin palvelimiin. Meillä on käyttäjän 'tecmint' edetä eteenpäin.

Luo käyttäjän tecmint kaikki 4 palvelinta käyttämällä useradd-komentoa kuvan mukaisesti.

# useradd -m tecmint

Jos haluat antaa pääkäyttöoikeuden tecmint-käyttäjälle, lisää seuraava rivi tiedostoon/etc/sudoers. Voit lisätä tämän rivin juuren alle kuvakaappauksena.

tecmint   ALL=(ALL)    ALL

Vaihda käyttäjän tecmint-tilaan ja luo ssh-avain master1 -kenttään alla olevan komennon avulla.

# sudo su tecmint
$ ssh-keygen

Kopioi luotu avain nyt kaikkiin 4 palvelimeen käyttämällä ssh-copy-id -komentoa kuvan mukaisesti.

$ ssh-copy-id -i ~/.ssh/id_rsa.pub [email 
$ ssh-copy-id -i ~/.ssh/id_rsa.pub [email 
$ ssh-copy-id -i ~/.ssh/id_rsa.pub [email  
$ ssh-copy-id -i ~/.ssh/id_rsa.pub [email 

Nyt sinun pitäisi pystyä ssh: stä master1 jäljellä oleviin palvelimiin ilman salasanaa, kuten kuvassa.

$ ssh master2
$ ssh worker1
$ ssh worker2
$ ssh worker3

Vaihe 4: Cloudera Managerin asentaminen ja määrittäminen

Voimme käyttää toimittajan (Cloudera) arkistoa kaikkien pakettien asentamiseen RHEL/CentOSin paketinhallintatyökalujen avulla. Reaaliajassa oman tietovaraston luominen on paras käytäntö, koska tuotantopalvelimilla ei ehkä ole Internet-yhteyttä.

Täällä aiomme asentaa Cloudera Manager 6.3.1 -julkaisun. Koska aiomme käyttää master1 -palautuspalvelinta, lataamme paketit alla mainittuun polkuun.

Luo alla mainitut hakemistot master1 -palvelimelle.

$ sudo mkdir -p /var/www/html/cloudera-repos/cm6

Voimme käyttää wget-työkalua pakettien lataamiseen http:n kautta. Joten asenna wget alla olevalla komennolla.

$ sudo yum -y install wget

Lataa seuraavaksi Cloudera Managerin tervatiedosto seuraavalla wget-komennolla.

$ wget https://archive.cloudera.com/cm6/6.3.1/repo-as-tarball/cm6.3.1-redhat7.tar.gz

Pura tar-tiedosto tiedostoon/var/www/html/cloudera-repos/cm6, jo olemme tehneet master1 -palvelimen palvelimena asentamalla http:n ja olemme testanneet selaimessa.

$ sudo tar xvfz cm6.3.1-redhat7.tar.gz -C /var/www/html/cloudera-repos/cm6 --strip-components=1

Tarkista nyt, että kaikki Cloudera rpm -tiedostot ovat hakemistossa/var/www/html/cloudera-repos/cm6/RPMS/x86_64.

$ cd /var/www/html/cloudera-repos/cm6
$ ll

Luo /etc/yum.repos.d/cloudera-manager.repo -tiedostot klusterin isäntien kaikille palvelimille, joiden sisältö on seuraava, tässä master1 (65.0.101.148) on verkkopalvelin.

[cloudera-repo]
name=cloudera-manager
baseurl=http:///cloudera-repos/cm6/
enabled=1
gpgcheck=0

Nyt arkisto on lisätty, suorita alla oleva komento nähdäksesi käytössä olevat arkistot.

$ yum repolist

Suorita alla oleva komento nähdäksesi kaikki käytettävissä olevat Cloudera-paketit.

$ yum list available | grep cloudera*

Asenna cloudera-manager-server, cloudera-manager-agent, cloudera-manager-daemons cloudera-manager-server-db-2.

$ sudo yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server cloudera-manager-server-db-2

Suorita alla oleva komento nähdäksesi kaikki asennetut Cloudera-paketit.

$ yum list installed | grep cloudera*

Suorita alla oleva komento aloittaaksesi cloudera-scm-server-db, joka on taustalla oleva tietokanta Cloudera Managerin ja muiden palvelujen metatietojen tallentamiseen.

Oletuksena Cloudera on tulossa postgre-sql-tiedostoon, joka on upotettu Cloudera Manageriin. Asennamme upotetun reaaliaikaiseen ulkoiseen tietokantaan, jota voidaan käyttää. Se voi olla Oracle, MySQL tai PostgreSQL.

$ sudo systemctl start cloudera-scm-server-db

Suorita alla oleva komento tarkistaaksesi tietokannan tilan.

$ sudo systemctl status cloudera-scm-server-db

Määritä Cloudera Manager -palvelimen db.properties.

$ vi /etc/cloudera-scm-server/db.properties

Määritä, että alla oleva arvo on EMBEDDED, jotta Cloudera Manager saadaan käyttämään upotettua tietokantaa.

com.cloudera.cmf.db.setupType=EMBEDDED

Käynnistä Cloudera Manager -palvelin suorittamalla seuraava komento.

$ sudo systemctl start cloudera-scm-server

Suorita alla oleva komento tarkistaaksesi Cloudera Manager -palvelimen tilan.

$ sudo systemctl status cloudera-scm-server

Suorita alla oleva komento aloittaaksesi ja tarkistaaksesi Cloudera Manager -agentin tilan.

$ sudo systemctl start cloudera-scm-agent
$ sudo systemctl status cloudera-scm-agent

Kun Cloudera Manager Server on onnistunut ja toimii hyvin, voit tarkastella WebUI: tä (kirjautumissivu) selaimessa käyttämällä IP-osoitetta ja porttinumeroa 7180, joka on Cloudera Managerin portin numero.

https://65.0.101.148:7180

Tässä artikkelissa olemme nähneet askel askeleelta prosessin Cloudera Managerin asentamiseksi CentOS 7: een. Näemme CDH: n ja muut palveluasennukset seuraavassa artikkelissa.