NGSIHDFSSink¶

コンテンツ :

機能性
管理ガイド
プログラマ・ガイド

機能性¶

com.iot.telefonica.cygnus.sinks.NGSIHDFSSink、または単なる NGSIHDFSSinkは、HDFS デプロイメント内で NGSI ライクのコンテキストデータ・イベントを維持するように設計されたシンクです。通常、このようなコンテキストデータは、Orion Context Broker インスタンスによって通知されますが、NGSI言語 を話す他のシステムである可能性があります。

データジェネレータとは無関係に、NGSI コンテキストデータは常に Cygnus ソースの内部オブジェクト NGSIEvent に変換されます。最終的には、これらのイベント内の情報を、Cygnus シンクの特定の HDFSデータ構造にマップする必要があります。

次のセクションでこれについて詳しく説明します。

パラメータ	必須	デフォルト値	コメント
type	yes	N/A	`com.telefonica.iot.cygnus.sinks.NGSIHDFSSink` である必要があります
channel	yes	N/A
enable_encoding	no	false	true または false。`true` は新しいエンコーディングを適用し、`false` は古いエンコーディングを適用します
enable_grouping	no	false	true または false。詳細については、このリンクをチェックしてください
enable_name_mappings	no	false	true または false。詳細については、このリンクをチェックしてください
enable_lowercase	no	false	true または false
data_model	no	dm-by-entity	構成されていなくても、常に `dm-by-entity` です
file_format	no	json-row	json-row, json-column, csv-row または json-column のいずれかになります
backend.impl	no	rest	rest は、HDFS とやりとりするときに WebHDFS/HttpFS ベースの実装が使用される場合。または、 binary は、HDFS とやりとりするときに Hadoop API ベースの実装が使用されている場合
backend.max_conns	no	500	Http ベースの HDFS バックエンドに許可される最大接続数。バイナリバックエンド実装を使用している場合は無視されます
backend.max_conns_per_route	no	100	Http ベースの HDFS バックエンドに許可されているルートごとの最大接続数。バイナリバックエンド実装を使用している場合は無視されます
hdfs_host	no	localhost	HDFS ネームノードが実行される FQDN/IPアドレス、またはHDFS HA ネームノードが実行される FQDN/IP アドレスのコンマ区切りリスト
hdfs_port	no	14000	HttpFS (rest) を使用する場合は14000、WebHDFS (rest) を使用する場合は50070、Hadoop API (binary) を使用する場合は8020
hdfs_username	yes	N/A	`service_as_namespace=false` の場合、HDFS の既存のユーザでなければなりません。`service_as_namespace=true` の場合、HDFS のスーパーユーザでなければなりません
hdfs_password	yes	N/A	上記 `hdfs_username` のパスワード。これは Hive 認証にのみ必要です
oauth2_token	yes	N/A	HDFS 認証に必要な OAuth2 トークン
service_as_namespace	no	false	true に設定されている場合は、`fiware-service` またはデフォルト・パスが、`hdfs_username` の代わりに、HDFS 名前空間として代わりに使用されます。この場合は HDFS スーパーユーザである必要があります
csv_separator	no	,
batch_size	no	1	永続化の前に蓄積されたイベントの数
batch_timeout	no	30	バッチがそのまま永続化される前に構築される秒数
batch_ttl	no	10	バッチを永続化できない場合のリトライ回数。リトライしない場合は `0`、無限にリトライする場合は `-1` を使用してください。無限のTTL(非常に大きいものでさえ)がすべてのシンクのチャネル容量を非常に素早く消費するかもしれないと考えてください
batch_retry_intervals	no	5000	永続化されていないバッチに関するリトライが行われるコンマ区切りの間隔(ミリ秒単位)のリスト。最初のリトライは、最初の値と同じ数ミリ秒後に実行され、2回目の再試行は2番目の値の後に完了します。`batch_ttl` が間隔の数より大きい場合、最後の間隔が繰り返されます
hive	no	true	true または false
hive.server_version	no	2	リモート Hive サーバが HiveServer1 を実行している場合は、`1` またはリモート Hive サーバが HiveServer2を実行している場合は、`2`
hive.host	no	ローカルホスト
hive.port	no	10000
hive.db_type	no	default-db	default-db または namespace-db。`hive.db_type=default-db` の場合、デフォルトのHiveデータベースが使用されます。`hive.db_type=namespace-db` と`service_as_namespace=false` の場合、`hdfs_username` が Hive データベースとして使用されます。`hive.db_type=namespace-db` と `service_as_namespace=true` の場合、通知された `fiware-service` は Hive データベースとして使用されます
krb5_auth	no	false	true または false
krb5_user	yes	empty	`krb5_auth=false` の場合は無視され、それ以外の場合は必須です
krb5_password	yes	empty	`krb5_auth=false` の場合は無視され、それ以外の場合は必須です
krb5_login_conf_file	no	/usr/cygnus/conf/krb5_login.conf	`krb5_auth=false` の場合は無視されます
krb5_conf_file	no	/usr/cygnus/conf/krb5.conf	`krb5_auth=false` の場合は無視されます

NGSIHDFSSink¶

機能性¶

NGSIEvent オブジェクトへの NGSI イベントのマッピング¶

HDFS データ構造への NGSIEvents のマッピング¶

HDFS パスの命名規則¶

Json 行ライクなストア¶

Json 列ライクなストア¶

CSV 行ライクなストア¶

CSV 列ライクなストア¶

Hive¶

例¶

NGSIEvent¶

パス名¶

新しいエンコーディングを使用 :¶

Json 列ライクなストア¶

CSV 行ライクなストア¶

CSV 列ライクなストア¶

Hive のストア¶

管理ガイド¶

構成¶

ユースケース¶

重要なメモ¶

永続化モード¶

バイナリ・バックエンド¶

バッチ処理¶

エンコーディング¶

プログラマ・ガイド¶

NGSIHDFSSink クラス¶

OAuth2 認証¶

Kerberos 認証¶

conf/cygnus.conf¶

conf/krb5_login.conf¶

conf/krb5.conf¶

`NGSIEvent` オブジェクトへの NGSI イベントのマッピング¶

HDFS データ構造への `NGSIEvent`s のマッピング¶

`NGSIEvent`¶

`NGSIHDFSSink` クラス¶

`conf/cygnus.conf`¶

`conf/krb5_login.conf`¶

`conf/krb5.conf`¶