Я подхожу к Hbase и мне нужно загрузить в него различные CSV временных рядов, в одной таблице.
В частности, у меня есть:
first.csv
+---+---+----------+-------------------+
|_c0| ID| log| datetime|
+---+---+----------+-------------------+
| 0| 9| 4r8|2001-12-10 01:00:00|
| 1| 45| 223|2001-12-10 01:00:00|
| 2| 9| iu8|2002-11-01 03:00:00|
секунда
+---+---+----------+-------------------+
|_c0| ID| message| datetime|
+---+---+----------+-------------------+
| 0| 9| ERROR|2001-12-10 01:00:00|
| 1| 45| SUCCESS|2001-12-10 01:00:00|
| 2| 9| SUCCESS|2002-11-01 03:00:00|
Я хочу загрузить в Hbase эту схему SuperColumnFamily:
ROW_KEY | ID = 9 | ID = 45
+-------------------+---------------+---------------+
| log | message | log | message |
|2001-12-10 01:00:00+-----+---------+---------------+
| 4r8 | ERROR | 223 | SUCCESS |
+-------------------+---------------+
| log | message |
|2002-12-01 03:00:00+-----+---------+
| iu8 | SUCCESS |
+-------------------+---------------+
Как это сделать?(MapR, Spark, CompleteBulkLoad?)