Docker file Cloudera Hue

Hue là một SQL Workbench mã nguồn mở dùng để tìm kiếm, truy xuất data và visualizing data cho cloud/on-prem Data Warehouses. Các tính năng chính:

  • Editors sử dụng SQL query để truy xuất, xử lý data
  • Dashboards có chức năng visualize data
  • Scheduler quản lý jobs và workflows
  • Browsers tìm kiếm data, phân loại data

1. Build Hue image

Các bạn chỉ cần đơn giản download repository https://github.com/nvtienanh/docker-hue

Sau đó build bằng lệnh: make build

2. Hue simple deploy

Ví dụ này sẽ hướng dẫn deploy Hue bằng docker-compose, các service cần sử dụng là: hue, namenode, datanode, historyserver. Chi tiết có thể tham khảo file docker-compose.yaml:

version: "3"

services:
  hue:
    image: nvtienanh/hue:${HUE_TAG}
    hostname: hue
    container_name: hue
    networks:
      - hadoop-net
    environment:
      - NAMENODE_HOST=namenode
    ports:
     - "8888:8888"
    volumes:
      - ./pseudo-distributed.ini:/usr/share/hue/desktop/conf/pseudo-distributed.ini

  namenode:
    image: nvtienanh/hadoop-namenode:${HADOOP_TAG}
    hostname: namenode
    container_name: namenode
    volumes:
      - ./data/namenode:/hadoop/dfs/name
    environment:
      - CLUSTER_NAME=test
    env_file:
      - ./hadoop.env
    networks:
      - hadoop-net

  datanode1:
    image: nvtienanh/hadoop-datanode:${HADOOP_TAG}
    hostname: datanode1
    container_name: datanode1
    volumes:
      - ./data/datanode1:/hadoop/dfs/data
    env_file:
      - ./hadoop.env
    networks:
      - hadoop-net
  
  datanode2:
    image: nvtienanh/hadoop-datanode:${HADOOP_TAG}
    hostname: datanode2
    container_name: datanode2
    volumes:
      - ./data/datanode2:/hadoop/dfs/data
    env_file:
      - ./hadoop.env
    networks:
      - hadoop-net
    
  historyserver:
    image: nvtienanh/hadoop-historyserver:${HADOOP_TAG}
    container_name: historyserver
    environment:
      SERVICE_PRECONDITION: "namenode:9870 datanode1:9864 datanode2:9864"
    volumes:
      - ./data/hadoop_historyserver:/hadoop/yarn/timeline
    env_file:
      - ./hadoop.env
    networks:
      - hadoop-net

networks:
  hadoop-net:
    external:
      name: hadoop-net

Chi tiết bạn có thể xem ở video này

3. Hue – Ldap

4. Hue – Hive

5. Hue – Hive -Ldap

Xem thêm

Bình luận