관리 메뉴

Enjoy what you do!

SAP HANA, Lumira 본문

컴공 여러가지/빅 데이터 Big Data

SAP HANA, Lumira

쵸코맛 비비빅 2018. 1. 21. 03:51

SAP HANA는 RDBMS 이지만 인메모리 그리고 컬럼기반으로 저장하고 압축 저장해서 처리 속도가 빨라 빅데이터 처리에 쓸수 있다고 한다.

그러나 하둡처럼 비정형 데이터는 저장못함. (컬럼 만들고 거기다 비정형 저장해도 된다는데 이런말은 누가 못하나)


SAP HANA는 컬럼 기반 DB라서 빠르다. 각각 컬럼 별로 따로따로 저장한다.

-> 컬럼 10개 조회해야되면 기존 RDBMS는 컬럼 모두(100) 조회해야 하지만(레코드 조회해야되니) 컬럼 기반은 딱 그 10개만 조회하면 돼서 빠르다.

-> 사실 컬럼 기반도 되고 로우 기반도 된다. 둘 다 지원.

 

그러면 한 레코드에서 한 컬럼 값만 수정해야하는 경우는? -> 비효율적이다.

그래서 델타라는 영역으로 나눠놨다.

 

HANA는 메인영역과 델타 영역으로 나뉘는데 메인 영역은 각 컬럼이 압축되어 저장되어있다. 레코드를 한 개 수정해야한다면 메인 영역에서 수정 안하고(메인영역은 압축되어있기 때문에 바로 수정하면 문제가 많아진다.) 델타영역에 수정해서 저장해놓는다.

그리고 나중에 메인영역에 반영한다.

 

HANA는 가장 중요한?(자주쓰이는?) 데이터는 인메모리에 저장하고 그 다음 중요한 데이터는 디스크에 컬럼 기반으로 저장하고 그 다음 중요한 데이터는 하둡에 저장한다.

 

HANA는 서버 구축 비용이 비싸다? -> 관계자분 말로는 조금 비싸다. 많이는 아니고.(일단 안 믿고 보자)

인메모리에 압축해서 저장하기 때문에 저장 용량이 현저히 줄어든다. 또한 백업 스토리지 또한 압축된 데이터로 저장하기 때문에 저장용량 현저히 들어든다.

-> 따라서 예를 들면 기존 DBMS100TB 저장할 걸 HANA는 압축해서 저장하므로 메모리에 10TB, 백업 스토리지에 10TB 저장한다.

  

루미라는 무엇인가?

비즈니스 사용자와 고급 사용자의 연결

파일에서 데이터 불러와서 그래프로 보여준다. 그래프 종류가 많더라.(근데 데이터량 많은건 그래프로 안보여지던데)

엑셀이나 여러 파일에서도 데이터 가져올 수 있지만 HANA의 데이터를 가져올수도 있다.(HANA 에 끼워팔기 좋겠다.)

'컴공 여러가지 > 빅 데이터 Big Data' 카테고리의 다른 글

빅 데이터  (0) 2018.01.19
Comments