中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Oracle源端怎么配置

發布時間:2021-12-09 15:26:41 來源:億速云 閱讀:111 作者:iii 欄目:云計算

這篇文章主要介紹“Oracle源端怎么配置”,在日常操作中,相信很多人在Oracle源端怎么配置問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Oracle源端怎么配置”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

Oracle里存儲的結構化數據導出到Hadoop體系做離線計算是一種常見數據處置手段。近期有場景需要做Oracle到Hadoop體系的實時導入,這里以此案例做以介紹。
Oracle作為商業化的數據庫解決方案,自發性的獲取數據庫事務日志等比較困難,故選擇官方提供的同步工具OGG(Oracle GoldenGate)來解決。

安裝與基本配置

環境說明

軟件配置

角色數據存儲服務及版本OGG版本IP
服務器OracleRelease11.2.0.1Oracle GoldenGate 11.2.1.0 for Oracle on Linux x86-6410.0.0.25
目標服務器Hadoop 2.7.2Oracle GoldenGate for Big Data 12.2.0.1 on Linux x86-6410.0.0.2

以上源服務器上OGG安裝在Oracle用戶下,目標服務器上OGG安裝在root用戶下。

注意

Oracle導出到異構的存儲系統,如MySQL,DB2,PG等以及對應的不同平臺,如AIX,Windows,Linux等官方都有提供對應的Oracle GoldenGate版本,可在這里或者在舊版本查詢下載安裝。

Oracle源端基礎配置

將下載到的對應OGG版本放在方便的位置并解壓,本示例Oracle源端最終的解壓目錄為/u01/gg。

  1. 配置環境變量
    這里的環境變量主要是對執行OGG的用戶添加OGG相關的環境變量,本示例為Oracle用戶添加的環境變量如下:(/home/oracle/.bash_profile文件)

    export OGG_HOME=/u01/gg/
    export LD_LIBRARY_PATH=$ORACLE_HOME/lib:$OGG_HOME:/lib:/usr/lib
    export CLASSPATH=$ORACLE_HOME/jdk/jre:$ORACLE_HOME/jlib:$ORACLE_HOME/rdbms/jlib


  2. Oracle打開歸檔模式
    使用如下命令查看當前是否為歸檔模式(archive)

    SQL> archive log list 
    Database log mode              Archive Mode
    Automatic archival             Enabled
    Archive destination            /u01/arch_log
    Oldest online log sequence     6
    Next log sequence to archive   8
    Current log sequence           8


    如非以上狀態,手動調整即可

    SQL> conn / as sysdba(以DBA身份連接數據庫) 
    SQL> shutdown immediate(立即關閉數據庫)
    SQL> startup mount(啟動實例并加載數據庫,但不打開)
    SQL> alter database archivelog(更改數據庫為歸檔模式)
    SQL> alter database open(打開數據庫)
    SQL> alter system archive log start(啟用自動歸檔)


  3. Oracle打開日志相關
    OGG基于輔助日志等進行實時傳輸,故需要打開相關日志確保可獲取事務內容。通過一下命令查看當前狀態:

    SQL> select force_logging, supplemental_log_data_min from v$database;
    FOR SUPPLEME--- --------
    YES YES


    如果以上查詢結果非YES,可通過以下命令修改狀態:

    SQL> alter database force logging;
    SQL> alter database add supplemental log data;


  4. Oracle創建復制用戶
    為了使Oracle里用戶的復制權限更加單純,故專門創建復制用戶,并賦予dba權限

    SQL> create tablespaceoggtbsdatafile '/u01/app/oracle/oradata/orcl/oggtbs01.dbf' size 1000M autoextend on;
    SQL> create user ggs identified by ggs default tablespaceoggtbs;
    User created.
    SQL> grant dba to ggs;
    Grant succeeded.


    最終這個ggs帳號的權限如下所示:

    SQL> select * from dba_sys_privs where GRANTEE='GGS';
    GRANTEE                        PRIVILEGE                                ADM
    GGS                            DROP ANY DIRECTORY                       NO
    GGS                            ALTER ANY TABLE                          NO
    GGS                            ALTER SESSION                            NO
    GGS                            SELECT ANY DICTIONARY                    NO
    GGS                            CREATE ANY DIRECTORY                     NO
    GGS                            RESTRICTED SESSION                       NO
    GGS                            FLASHBACK ANY TABLE                      NO
    GGS                            UPDATE ANY TABLE                         NO
    GGS                            DELETE ANY TABLE                         NO
    GGS                            CREATE TABLE                             NO
    GGS                            INSERT ANY TABLE                         NO
    GRANTEE                        PRIVILEGE                                ADM
    GGS                            UNLIMITED TABLESPACE                     NO
    GGS                            CREATE SESSION                           NO
    GGS                            SELECT ANY TABLE                         NO


  5. OGG初始化
    進入OGG的主目錄執行./ggsci,進入OGG命令行

    [oracle@VM_0_25_centos gg]$ ./ggsci 
    Oracle GoldenGate Command Interpreter for Oracle
    Version 11.2.1.0.3 14400833 OGGCORE_11.2.1.0.3_PLATFORMS_120823.1258_FBO
    Linux, x64, 64bit (optimized), Oracle 11g on Aug 23 2012 20:20:21
    Copyright (C) 1995, 2012, Oracle and/or its affiliates. All rights reserved.
    GGSCI (VM_0_25_centos) 1>
    執行create subdirs進行目錄創建
    GGSCI (VM_0_25_centos) 4> create subdirs
    Creating subdirectories under current directory /u01/gg
    Parameter files                /u01/gg/dirprm: already exists
    Report files                   /u01/gg/dirrpt: already exists
    Checkpoint files               /u01/gg/dirchk: already exists
    Process status files           /u01/gg/dirpcs: already exists
    SQL script files               /u01/gg/dirsql: already exists
    Database definitions files     /u01/gg/dirdef: already exists
    Extract data files             /u01/gg/dirdat: already exists
    Temporary files                /u01/gg/dirtmp: already exists
    Stdout files                   /u01/gg/dirout: already exists


  6. Oracle創建模擬復制庫表
    模擬建一個用戶叫tcloud,密碼tcloud,同時基于這個用戶建一張表,叫t_ogg

    SQL> create user tcloud  identified by tcloud default tablespace users;
    User created.
    SQL> grant dba to tcloud;
    Grant succeeded.
    SQL> conn tcloud/tcloud;
    Connected.
    SQL> create table t_ogg(id int ,text_name varchar(20),primary key(id));
    Table created.


目標端基礎配置

將下載到的對應OGG版本放在方便的位置并解壓,本示例Oracle目標端最終的解壓目錄為/data/gg

  1. 配置環境變量
    這里需要用到HDFS相關的庫,故需要配置java環境變量以及OGG相關,并引入HDFS的相關庫文件,參考配置如下:

    export JAVA_HOME=/usr/java/jdk1.7.0_75/
    export LD_LIBRARY_PATH=/usr/java/jdk1.7.0_75/jre/lib/amd64:/usr/java/jdk1.7.0_75/jre/lib/amd64/server:/usr/java/jdk1.7.0_75/jre/lib/amd64/libjsig.so:/usr/java/jdk1.7.0_75/jre/lib/amd64/server/libjvm.so:$OGG_HOME:/lib
    export OGG_HOME=/data/gg


  2. OGG初始化
    目標端的OGG初始化和源端類似進入OGG的主目錄執行./ggsci,進入OGG命令行

    GGSCI (10.0.0.2) 2> create subdirs
    Creating subdirectories under current directory /data/gg
    Parameter files                /data/gg/dirprm: already exists
    Report files                   /data/gg/dirrpt: already exists
    Checkpoint files               /data/gg/dirchk: already exists
    Process status files           /data/gg/dirpcs: already exists
    SQL script files               /data/gg/dirsql: already exists
    Database definitions files     /data/gg/dirdef: already exists
    Extract data files             /data/gg/dirdat: already exists
    Temporary files                /data/gg/dirtmp: already exists
    Credential store files         /data/gg/dircrd: already exists
    Masterkey wallet files         /data/gg/dirwlt: already exists
    Dump files                     /data/gg/dirdmp: already exists


Oracle源配置

Oracle實時傳輸到Hadoop集群(HDFS,Hive,Kafka等)的基本原理如圖:
Oracle源端怎么配置
根據如上原理,配置大概分為如下步驟:源端目標端配置ogg管理器(mgr);源端配置extract進程進行Oracle日志抓取;源端配置pump進程傳輸抓取內容到目標端;目標端配置replicate進程復制日志到Hadoop集群或者復制到用戶自定義的解析器將最終結果落入到Hadoop集群。

配置全局變量

在源端服務器OGG主目錄下,執行./ggsci到OGG命令行下,執行如下命令:

GGSCI (VM_0_25_centos) 1> dblogin userid ggs password ggs
Successfully logged into database.
GGSCI (VM_0_25_centos) 3> view params ./globals
ggschema ggs

其中./globals變量沒有的話可以用edit params ./globals來編輯添加即可(編輯器默認使用的vim)

配置管理器mgr

在OGG命令行下執行如下命令:

GGSCI (VM_0_25_centos) 4> edit param mgr
PORT 7809
DYNAMICPORTLIST 7810-7909
AUTORESTART EXTRACT *,RETRIES 5,WAITMINUTES 3
PURGEOLDEXTRACTS ./dirdat/*,usecheckpoints, minkeepdays 3

說明:PORT即mgr的默認監聽端口;DYNAMICPORTLIST動態端口列表,當指定的mgr端口不可用時,會在這個端口列表中選擇一個,最大指定范圍為256個;AUTORESTART重啟參數設置表示重啟所有EXTRACT進程,最多5次,每次間隔3分鐘;PURGEOLDEXTRACTS即TRAIL文件的定期清理
在命令行下執行start mgr即可啟動管理進程,通過info mgr可查看mgr狀態

GGSCI (VM_0_25_centos) 5> info mgr
Manager is running (IP port VM_0_25_centos.7809).
添加復制表

在OGG命令行下執行添加需要復制的表的操作,如下:

GGSCI (VM_0_25_centos) 7> add trandata tcloud.t_ogg
Logging of supplemental redo data enabled for table TCLOUD.T_OGG.
GGSCI (VM_0_25_centos) 8> info trandata tcloud.t_ogg
Logging of supplemental redo log data is enabled for table TCLOUD.T_OGG.
Columns supplementally logged for table TCLOUD.T_OGG: ID.
配置extract進程

配置extract進程OGG命令行下執行如下命令:

GGSCI (VM_0_25_centos) 10> edit params ext2hd
extract ext2hd
dynamicresolution
SETENV (ORACLE_SID = "orcl")
SETENV (NLS_LANG = "american_america.AL32UTF8")
userid ggs,password ggs
exttrail /u01/gg/dirdat/tc
table tcloud.t_ogg;

說明:第一行指定extract進程名稱;dynamicresolution動態解析;SETENV設置環境變量,這里分別設置了Oracle數據庫以及字符集;userid ggs,password ggs即OGG連接Oracle數據庫的帳號密碼,這里使用2.3.4中特意創建的復制帳號;exttrail定義trail文件的保存位置以及文件名,注意這里文件名只能是2個字母,其余部分OGG會補齊;table即復制表的表明,支持*通配,必須以;結尾
接下來在OGG命令行執行如下命令添加extract進程:

GGSCI (VM_0_25_centos) 11> add extract ext2hd,tranlog,begin now
EXTRACT added.

最后添加trail文件的定義與extract進程綁定:

GGSCI (VM_0_25_centos) 12> add exttrail /u01/gg/dirdat/tc,extract ext2hd
EXTTRAIL added

可在OGG命令行下通過info命令查看狀態:

GGSCI (VM_0_25_centos) 14> info ext2hd
EXTRACT    EXT2HD    Initialized   2016-11-09 15:37   Status STOPPED
Checkpoint Lag       00:00:00 (updated 00:02:32 ago)
Log Read Checkpoint  Oracle Redo Logs
                     2016-11-09 15:37:14  Seqno 0, RBA 0
                     SCN 0.0 (0)
配置pump進程

pump進程本質上來說也是一個extract,只不過他的作用僅僅是把trail文件傳遞到目標端,配置過程和extract進程類似,只是邏輯上稱之為pump進程
在OGG命令行下執行:

GGSCI (VM_0_25_centos) 16> edit params push3hd
extract push3hd
passthru
dynamicresolution
userid ggs,password ggs
rmthost 10.0.0.2 mgrport 7809
rmttrail /data/gg/dirdat/tc
table tcloud.t_ogg;

說明:第一行指定extract進程名稱;passthru即禁止OGG與Oracle交互,我們這里使用pump邏輯傳輸,故禁止即可;dynamicresolution動態解析;userid ggs,password ggs即OGG連接Oracle數據庫的帳號密碼,這里使用2.3.4中特意創建的復制帳號;rmthost和mgrhost即目標端OGG的mgr服務的地址以及監聽端口;rmttrail即目標端trail文件存儲位置以及名稱
分別將本地trail文件和目標端的trail文件綁定到extract進程:

GGSCI (VM_0_25_centos) 17> add extract push3hd,exttrailsource /u01/gg/dirdat/tc
EXTRACT added.
GGSCI (VM_0_25_centos) 18> add rmttrail /data/gg/dirdat/tc,extract push3hd
RMTTRAIL added.

同樣可以在OGG命令行下使用info查看進程狀態:

GGSCI (VM_0_25_centos) 19> info push3hd

EXTRACT    PUSH2HD   Initialized   2016-11-09 15:52   Status STOPPED
Checkpoint Lag       00:00:00 (updated 00:01:04 ago)
Log Read Checkpoint  File /u01/gg/dirdat/tc000000
                     First Record  RBA 0
配置define文件

Oracle與MySQL,Hadoop集群(HDFS,Hive,kafka等)等之間數據傳輸可以定義為異構數據類型的傳輸,故需要定義表之間的關系映射,在OGG命令行執行:

GGSCI (VM_0_25_centos) 20> edit params tcloud
defsfile /u01/gg/dirdef/tcloud.t_ogg
userid ggs,password ggs
table tcloud.t_ogg;

在OGG主目錄下執行:
./defgen paramfile dirprm/tcloud.prm
完成之后會生成這樣的文件/u01/gg/dirdef/tcloud.t_ogg,將這個文件拷貝到目標端的OGG主目錄下的dirdef目錄即可。

目標端的配置

創建目標表(目錄)

這里主要是當目標端為HDFS目錄或者Hive表或者MySQL數據庫時需要手動先在目標端創建好目錄或者表,創建方法都類似,這里我們模擬實時傳入到HDFS目錄,故手動創建一個接收目錄即可
hadoop –fs mkdir /gg/replication/hive/

配置管理器mgr

目標端的OGG管理器(mgr)和源端的配置類似,在OGG命令行下執行:

GGSCI (10.0.0.2) 2> edit params mgr
PORT 7809
DYNAMICPORTLIST 7810-7909
AUTORESTART EXTRACT *,RETRIES 5,WAITMINUTES 3
PURGEOLDEXTRACTS ./dirdat/*,usecheckpoints, minkeepdays 3
配置checkpoint

checkpoint即復制可追溯的一個偏移量記錄,在全局配置里添加checkpoint表即可

GGSCI (10.0.0.2) 5> edit  params  ./GLOBALS
CHECKPOINTTABLE tcloud.checkpoint

保存即可

配置replicate進程

在OGG的命令行下執行:

GGSCI (10.0.0.2) 8> edit params r2hdfs
REPLICAT r2hdfs
sourcedefs /data/gg/dirdef/tcloud.t_ogg
TARGETDB LIBFILE libggjava.so SET property=dirprm/hdfs.props
REPORTCOUNT EVERY 1 MINUTES, RATE 
GROUPTRANSOPS 10000
MAP tcloud.t_ogg, TARGET tcloud.t_ogg;

說明:REPLICATE r2hdfs定義rep進程名稱;sourcedefs即在3.6中在源服務器上做的表映射文件;TARGETDB LIBFILE即定義HDFS一些適配性的庫文件以及配置文件,配置文件位于OGG主目錄下的dirprm/hdfs.props;REPORTCOUNT即復制任務的報告生成頻率;GROUPTRANSOPS為以事務傳輸時,事務合并的單位,減少IO操作;MAP即源端與目標端的映射關系
其中property=dirprm/hdfs.props的配置中,最主要的幾項配置及注釋如下:

gg.handlerlist=hdfs //OGG for Big Data中handle類型
gg.handler.hdfs.type=hdfs //OGG for Big Data中HDFS目標
gg.handler.hdfs.rootFilePath=/gg/replication/hive/ //OGG for Big Data中HDFS存儲主目錄
gg.handler.hdfs.mode=op //OGG for Big Data中傳輸模式,即op為一次SQL傳輸一次,tx為一次事務傳輸一次
gg.handler.hdfs.format=delimitedtext //OGG for Big Data中文件傳輸格式
gg.classpath=/usr/hdp/2.2.0.0-2041/hadoop/share/hadoop/common/*:/usr/hdp/2.2.0.0-2041/hadoop/share/hadoop/common/lib/*:/usr/hdp/2.2.0.0-2041/hadoop/share/hadoop/hdfs/*:/usr/hdp/2.2.0.0-2041/hadoop/etc/hadoop/:/data/gg/:/data/gg/lib/*:/usr/hdp/2.2.0.0-2041/hadoop/client/* //OGG for Big Data中使用到的HDFS庫的定義

具體的OGG for Big Data支持參數以及定義可參考地址

最后在OGG的命令行下執行:

GGSCI (10.0.0.2) 9> add replicat r2hdfs exttrail /data/gg/dirdat/tc,checkpointtable tcloud.checkpointtab
REPLICAT added.

將文件與復制進程綁定即可

測試

啟動進程

在源端和目標端的OGG命令行下使用start [進程名]的形式啟動所有進程。
啟動順序按照源mgr——目標mgr——源extract——源pump——目標replicate來完成。

檢查進程狀態

以上啟動完成之后,可在源端與目標端的OGG命令行下使用info [進程名]來查看所有進程狀態,如下:
源端:

GGSCI (VM_0_25_centos) 7> info mgr
Manager is running (IP port VM_0_25_centos.7809).
GGSCI (VM_0_25_centos) 9> info ext2hd
EXTRACT    EXT2HD    Last Started 2016-11-09 16:05   Status RUNNING
Checkpoint Lag       00:00:00 (updated 00:00:09 ago)
Log Read Checkpoint  Oracle Redo Logs
                     2016-11-09 16:45:51  Seqno 8, RBA 132864000
                     SCN 0.1452333 (1452333)
GGSCI (VM_0_25_centos) 10> info push3hd
EXTRACT    PUSH2HD   Last Started 2016-11-09 16:05   Status RUNNING
Checkpoint Lag       00:00:00 (updated 00:00:01 ago)
Log Read Checkpoint  File /u01/gg/dirdat/tc000000
                     First Record  RBA 1043

目標端:

GGSCI (10.0.0.2) 13> info mgr 
Manager is running (IP port 10.0.0.2.7809, Process ID 8242).

GGSCI (10.0.0.2) 14> info r2hdfs
REPLICAT   R2HDFS    Last Started 2016-11-09 16:45   Status RUNNING
Checkpoint Lag       00:00:00 (updated 00:00:02 ago)
Process ID           4733
Log Read Checkpoint  File /data/gg/dirdat/tc000000
                     First Record  RBA 0

所有的狀態均是RUNNING即可。(當然也可以使用info all來查看所有進程狀態)

測試同步更新效果

測試方法比較簡單,直接在源端的數據表中insert,update,delete操作即可。由于Oracle到Hadoop集群的同步是異構形式,目前尚不支持truncate操作。
源端進行insert操作

SQL> conn tcloud/tcloud
Connected.
SQL> select * from t_ogg;
no rows selected
SQL> desc t_ogg;
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 ID                                        NOT NULL NUMBER(38)
 TEXT_NAME                                          VARCHAR2(20)
SQL> insert into t_ogg values(1,'test');
1 row created.
SQL> commit;
Commit complete.

查看源端trail文件狀態

[oracle@VM_0_25_centos dirdat]$ ls -l /u01/gg/dirdat/tc*
-rw-rw-rw- 1 oracle oinstall 1180 Nov  9 17:05 /u01/gg/dirdat/tc000000

查看目標端trail文件狀態

[root@10 dirdat]# ls -l /data/gg/dirdat/tc*      
-rw-r----- 1 root root 1217 Nov  9 17:05 /data/gg/dirdat/tc000000

查看HDFS中是否有寫入

hadoop fs -ls /gg/replication/hive/tcloud.t_ogg
-rw-rw-r--   3 root hdfs        110 2016-11-09 17:05
/gg/replication/hive/tcloud.t_ogg/tcloud.t_ogg_2016-11-09_17-05-30.514.txt

注意:從寫入到HDFS的文件內容看,文件的格式如下:

ITCLOUD.T_OGG2016-11-09 09:05:25.0670822016-11-09T17:05:30.51200000000000000000001080ID1TEXT_NAMEtest

很明顯Oracle的數據已準實時導入到HDFS了。導入的內容實際是一條條的類似流水日志(具體日志格式不同的傳輸格式,內容略有差異,本例使用的delimitedtext。格式為操作符 數據庫.表名 操作時間戳(GMT+0) 當前時間戳(GMT+8) 偏移量 字段1名稱 字段1內容 字段2名稱 字段2內容),如果要和Oracle的表內容完全一致,需要客戶手動實現解析日志并寫入到Hive的功能,這里官方并沒有提供適配器。目前騰訊側已實現該功能的開發。
當然你可以直接把這個HDFS的路徑通過LOCATION的方式在Hive上建外表(external table)達到實時導入Hive的目的。

總結

OGG for Big Data實現了Oracle實時同步到Hadoop體系的接口,但得到的日志目前仍需應用層來解析(關系型數據庫如MySQL時OGG對應版本已實現應用層的解析,無需人工解析)。
OGG的幾個主要進程mgr,extract,pump,replicate配置方便,可快速配置OGG與異構關系存儲結構的實時同步。后續如果有新增表,修改對應的extract,pump和replicate進程即可,當然如果是一整個庫,在配置上述2個進程時,使用通配的方式即可。

附錄

OGG到Hadoop體系的實時同步時,可在源端extract和pump進程配置不變的情況下,直接在目標端增加replicate進程的方式,增加同步目標,以下簡單介紹本示例中增加同步到Kafka的配置方法。
本示例中extract,pump進程都是現成的,無需再添加。只需要在目標端增加同步到Kafka的replicate進程即可。

在OGG的命令行下執行:

GGSCI (10.0.0.2) 4> edit params r2kafka
REPLICAT r2kafka
sourcedefs /data/gg/dirdef/tcloud.t_ogg
TARGETDB LIBFILE libggjava.so SET property=dirprm/r2kafka.props
REPORTCOUNT EVERY 1 MINUTES, RATE
GROUPTRANSOPS 10000
MAP tcloud.t_ogg, TARGET tcloud.t_ogg;

replicate進程和導入到HDFS的配置類似,差異是調用不同的配置dirprm/r2kafka.props。這個配置的主要配置如下:

gg.handlerlist = kafkahandler //handler類型
gg.handler.kafkahandler.type = kafka
gg.handler.kafkahandler.KafkaProducerConfigFile=custom_kafka_producer.properties //kafka相關配置
gg.handler.kafkahandler.TopicName =ggtopic //kafka的topic名稱,無需手動創建
gg.handler.kafkahandler.format =json //傳輸文件的格式,支持json,xml等
gg.handler.kafkahandler.mode =op  //OGG for Big Data中傳輸模式,即op為一次SQL傳輸一次,tx為一次事務傳輸一次
gg.classpath=dirprm/:/usr/hdp/2.2.0.0-2041/kafka/libs/*:/data/gg/:/data/gg/lib/* //相關庫文件的引用

r2kafka.props引用的custom_kafka_producer.properties定義了Kafka的相關配置如下:

bootstrap.servers=10.0.0.62:6667 //kafkabroker的地址
acks=1
compression.type=gzip //壓縮類型
reconnect.backoff.ms=1000 //重連延時

value.serializer=org.apache.kafka.common.serialization.ByteArraySerializer
key.serializer=org.apache.kafka.common.serialization.ByteArraySerializer
batch.size=102400
linger.ms=10000

以上配置以及其他可配置項可參考地址:

以上配置完成后,在OGG命令行下添加trail文件到replicate進程并啟動導入到Kafka的replicate進程

GGSCI (10.0.0.2) 5> add replicat r2kafka exttrail
/data/gg/dirdat/tc,checkpointtable tcloud.checkpoint
REPLICAT added.
GGSCI (10.0.0.2) 6> start r2kafka
Sending START request to MANAGER ...
REPLICAT R2KAFKA starting
GGSCI (10.0.0.2) 10> info r2kafka

REPLICAT   R2KAFKA   Last Started 2016-11-09 17:59   Status RUNNING
Checkpoint Lag       00:00:00 (updated 00:00:09 ago)
Process ID           5236
Log Read Checkpoint  File /data/gg/dirdat/tc000000
                     2016-11-09 17:05:25.067082  RBA 1217

檢查實時同步到kafka的效果,在Oracle源端更新表的同時,使用kafka客戶端自帶的腳本去查看這里配置的ggtopic這個kafkatopic下的消息:

SQL> insert into t_ogg values(2,'test2');
1 row created.
SQL> commit;
Commit complete.

目標端Kafka的同步情況:

[root@10 kafka]# bin/kafka-console-consumer.sh --zookeeper  10.0.0.223:2181  --
from-beginning --topic ggtopic
{"table":"TCLOUD.T_OGG","op_type":"I","op_ts":"2016-11-09
09:05:25.067082","current_ts":"2016-11-
09T17:59:20.943000","pos":"00000000000000001080","after":
{"ID":"1","TEXT_NAME":"test"}}
{"table":"TCLOUD.T_OGG","op_type":"I","op_ts":"2016-11-09 
10:02:06.827204","current_ts":"2016-11-
09T18:02:12.323000","pos":"00000000000000001217","after":
{"ID":"2","TEXT_NAME":"test2"}}

顯然,Oracle的數據已準實時同步到Kafka。從頭開始消費這個topic發現之前的同步信息也存在。架構上可以直接接Storm,SparkStreaming等直接消費kafka消息進行業務邏輯的處理。
從Oracle實時同步到其他的Hadoop集群中,官方最新版本提供了HDFS,HBase,Flume和Kafka,相關配置可參考官網給出的例子配置即可。

到此,關于“Oracle源端怎么配置”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

曲麻莱县| 青河县| 会同县| 绵竹市| 青铜峡市| 安丘市| 五华县| 金堂县| 屯留县| 宁远县| 海兴县| 双桥区| 凤庆县| 渭源县| 象州县| 依安县| 梁平县| 沁水县| 田阳县| 辛集市| 清镇市| 庆阳市| 东丰县| 鄢陵县| 南充市| 加查县| 彩票| 原平市| 晋江市| 平远县| 安宁市| 中江县| 彝良县| 文成县| 故城县| 临沭县| 永川市| 叶城县| 陆川县| 余庆县| 蚌埠市|