tsalakh ain sus noam Huyah ol guf

勉強会のメモ。その他備忘録。参考にさせて頂いたサイトや資料はリンクさせて頂いていますが不都合があればご連絡ください。

【勉強会】Apache Kafka Meetup Japan #2

kafka-apache-jp.connpass.com


噛み砕いてKafka Streams

  • ヤフー株式会社 森谷大輔さん

Window

Tumbling time window 5分毎のユーザ毎のPV数とか

Hopping time window 1つのイベントが複数のウィンドウにまたがる

Kafka Streamsのコンセプトがわかってから設計した方がいい Kafkaの素のAPIでも十分


Queryable State for Kafka Streamsを使ってみた

Kafka→Storm→Redis Kafka→KafkaStreams

Kafka Streams

Stateless Transformations Stateful Transformations

State for Kafka Streams

Statefulでしか使われない

Stateは対障害性を高める仕組み 処理結果を同時に2カ所に保存 State Store(RockDB) 内部Kafkaトピック(Log)

Queryable State

ReadOnlyKeyValueStore ReadOnlyWindowStore


Kafka for HDInsight

その後,この活動はHortonworks社のHadoopディストリビューションである“Hortonworks Data Platform”のWindows版,”HDP for Windows”として結実しました。

これを,MicrosoftパブリッククラウドであるWindows Azureで利用できるようにしたものが,今回の主題「Windows Azure HDInsightサービス」です。


Kafka logをオブジェクトストレージに連携する方法まとめ

  • tansanさん

AWS S3に アーカイブ目的

Kafka connect

Secor


Kafka通常オペレーションで遭遇する問題集

  • ヤフー株式会社 梁浩軒さん

Processing Kafka topics for monitoring with Prometheus

ogibayashi

Prometheus Key/Valueに属性をもたせてクエリかける FilterとかGroupByとか

Dashboardが貧弱なのでGraphana使ってる

集計はApache Flink

データパイプラインであったトラブル

WebサーバのログをHadoopに届ける 150TB/day Kafkaベースで試行錯誤 オンプレ200台くらい

kernel関連でパッチ ラック単位で