하이브 (Apache Hive) 1. 개요
시작하면서 하이브(hive)는 분산 환경에서 대용량 데이터를 읽거나 쓰고 관리하기 위해 개발된 데이터 웨어하우스 소프트웨어입니다. 그런데 대용량 데이터, 즉 빅데이터를 읽고 쓰는 것이 무엇이 그렇게 특별하며 또 웨어하우스는 무엇일까요? 그리고 왜 기업들은 하이브를 고집할까요. 이제 시작하겠습니다. 데이터 웨어하우스의 등장 사람들은 대부분 데이터베이스를 알고 있지만 데이터 웨어하우스는 생소할 것이에요. 참고한 Apache Hive Essentials - Dayong D. 책과 위키에 데이터베이스와 관련한 역사이야기가 나와서, 이해를 쉽게 돕기 위해 한번 공유해보겠습니다. 1960년대 1960년대 이전까지만 해도 기업들은 디스크에 데이터를 읽고 쓰는 것에 그쳤습니다. 사실 디스크라고도 뭐하지만 자기 테이프를..
2021.01.29