您好,登錄后才能下訂單哦!
本篇內容主要講解“HIVE有哪些數據類型”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“HIVE有哪些數據類型”吧!
類型 | 后綴 | 例子 |
---|---|---|
TINYINT | Y | 100Y |
SMALLINT | S | 100S |
BIGINT | L | 100L |
INTEGER is introduced as a synonym for INT in Hive 2.2.0 (HIVE-14950).
2. Decimals
Hive的小數型是基于Java BigDecimal做的, BigDecimal在java中用于表示任意精度的小數類型。所有常規數字運算(例如+, - ,*,/)和相關的UDFs(例如Floor,Ceil,Round等等)都使用和支持Decimal。你可以將Decimal和其他數值型互相轉換,且Decimal支持科學計數法和非科學計數法。因此,無論您的數據集是否包含如4.004E + 3(科學記數法)或4004(非科學記數法)或兩者的組合的數據,可以使用Decimal。
從Hive 0.13開始,用戶可以使用DECIMAL(precision, scale) 語法在創建表時來定義Decimal數據類型的precision和scale。 如果未指定precision,則默認為10。如果未指定scale,它將默認為0(無小數位)。
CREATE TABLE foo (
a DECIMAL, – Defaults to decimal(10,0)
b DECIMAL(9, 7)
)
大于BIGINT的數值,需要使用BD后綴以及Decimal(38,0)來處理,例:
select CAST(18446744073709001000BD AS DECIMAL(38,0)) from my_table limit 1;
Decimal在Hive 0.12.0 and 0.13.0之間是不兼容的,故0.12前的版本需要遷移才可繼續使用,具體情況參見官網。
類型 | 支持版本 |
---|---|
TIMESTAMP | Note: Only available starting with Hive 0.8.0 |
DATE | Note: Only available starting with Hive 0.12.0 |
INTERVAL | Note: Only available starting with Hive 1.2.0 |
1. Timestamps
支持傳統的UNIX時間戳和可選的納秒精度。
- 支持的轉化:
- 整數數字類型:以秒為單位解釋為UNIX時間戳
- 浮點數值類型:以秒為單位解釋為UNIX時間戳,帶小數精度
- 字符串:符合JDBC java.sql.Timestamp格式“YYYY-MM-DD HH:MM:SS.fffffffff”(9位小數位精度)
時間戳被解釋為無時間的,并被存儲為從Unix紀元的偏移量。 提供了用于轉換到和從時區轉換的便捷UDFs(to_utc_timestamp,from_utc_timestamp)。
所有現有的日期時間UDFs(月,日,年,小時等)都使用TIMESTAMP數據類型。
Text files中的時間戳必須使用格式yyyy-mm-dd hh:mm:ss [.f …]。 如果它們是另一種格式,請將它們聲明為適當的類型(INT,FLOAT,STRING等),并使用UDF將它們轉換為時間戳。
在表級別上,可以通過向SerDe屬性”timestamp.formats”(自版本1.2.0 with HIVE-9298)提供格式來支持備選時間戳格式。 例如,yyyy-MM-dd’T’HH:mm:ss.SSS,yyyy-MM-dd’T’HH:mm:ss。
2. Dates
DATE值描述特定的年/月/日,格式為YYYY-MM-DD。 例如,DATE’2013-01-01’。 日期類型沒有時間組件。 Date類型支持的值范圍是0000-01-01到9999-12-31,這取決于Java Date類型的原始支持。
Date types只能在Date, Timestamp, or String types之間轉換。
1.Strings
字符串文字可以用單引號(’)或雙引號(“)表示。Hive在字符串中使用C風格的轉義。
2. Varchar
Varchar類型使用長度說明符(介于1和65355之間)創建,它定義字符串中允許的最大字符數。 如果要轉換/分配給varchar值的字符串值超過length說明符,則字符串將被靜默截斷。 字符長度由字符串包含的代碼點的數量確定。
像字符串一樣,尾部空格在varchar中很重要,并且會影響比較結果。
非通用UDFs不能直接使用varchar類型作為輸入參數或返回值。 可以創建字符串UDFs,而varchar值將被轉換為strings并傳遞到UDF。 要直接使用varchar參數或返回varchar值,請創建GenericUDF。
如果基于reflection-based方法來獲取數據類型信息,則可能存在不支持varchar的場景。 這包括一些SerDe函數實現。
3. Char
字符類型與Varchar類似,但它們是固定長度的,意味著比指定長度值短的值用空格填充,但尾隨空格在比較期間不重要。 最大長度固定為255。
CREATE TABLE foo (bar CHAR(10))
<table font-size:16px;background-color:#FFFFFF;">
類型 | 支持版本 | |
---|---|---|
arrays | ARRAY(data_type) | Note: negative values and non-constant expressions are allowed as of Hive 0.14. |
maps | MAP(primitive_type, data_type) | Note: negative values and non-constant expressions are allowed as of Hive 0.14. |
structs | STRUCTcol_name : data_type [COMMENT col_comment], …) | |
union | UNIONTYPE(data_type, data_type, …) | Note: Only available starting with Hive 0.7.0. |
到此,相信大家對“HIVE有哪些數據類型”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。