Iceberg SQL 是基于 Apache Iceberg 的 SQL 查詢接口,用于處理大規模數據集。以下是一些基本的使用步驟和示例:
使用 CREATE TABLE
語句創建一個新的表。例如,以下語句創建一個名為 my_table
的表,其中包含 id
、name
和 timestamp
三個列:
CREATE TABLE my_table (
id INT,
name STRING,
timestamp TIMESTAMP
)
USING iceberg;
使用 INSERT INTO
語句向表中插入數據。例如,以下語句向 my_table
表中插入三條記錄:
INSERT INTO my_table (id, name, timestamp)
VALUES (1, 'Alice', '2023-01-01 00:00:00'),
(2, 'Bob', '2023-01-02 00:00:00'),
(3, 'Charlie', '2023-01-03 00:00:00');
使用 SELECT
語句查詢表中的數據。例如,以下語句查詢 my_table
表中的所有記錄:
SELECT * FROM my_table;
你還可以使用 WHERE
子句過濾結果,使用 ORDER BY
子句排序結果,以及使用聚合函數(如 COUNT()
、SUM()
等)進行數據處理。
Iceberg SQL 支持部分更新表中的數據。你可以使用 UPDATE
語句來更新滿足特定條件的記錄。例如,以下語句將 my_table
表中 name
列值為 ‘Alice’ 的記錄的 timestamp
列值更新為 ‘2023-01-05 00:00:00’:
UPDATE my_table
SET timestamp = '2023-01-05 00:00:00'
WHERE name = 'Alice';
Iceberg SQL 支持刪除表中的數據。你可以使用 DELETE
語句來刪除滿足特定條件的記錄。例如,以下語句刪除 my_table
表中 timestamp
列值小于 ‘2023-01-02 00:00:00’ 的記錄:
DELETE FROM my_table
WHERE timestamp < '2023-01-02 00:00:00';
注意:以上示例假設你已經正確配置了 Iceberg 和相關的依賴項。在實際使用中,你可能需要根據你的具體環境和需求進行適當的調整和優化。