re:Inventに行ってきました - 気になった新サービス / AWS re:Invent2016 Participants LT
by
koid
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
re:Inventに⾏ってきました - 気になった新サービス - 株式会社Gunosy ⼩出 幸典
Slide 2
Slide 2 text
⾃⼰紹介 • 名前 – ⼩出 幸典 (こいで ゆきのり) • 所属 – 株式会社Gunosy • プロビジョニング・デプロイフローの共通化とか • 過剰リソース警察、コスト削減おじさん • 好きなAWSサービス – OpsWorks, Lambda, Trusted Advisor, 最近はKinesisファミリー
Slide 3
Slide 3 text
株式会社Gunosy – 「情報を世界中の⼈に最適に届ける」 • Gunosyは 情報キュレーションサービス「グノシー」と • 2016年6⽉1⽇にKDDI株式会社と共同でリリースした 無料ニュース配信アプリ「ニュースパス」を提供する • 会社です。「情報を世界中の⼈に最適に届ける」を ビジョンに活動しています。 ネット上に存在するさまざまな情報を、 独⾃のアルゴリズムで収集、評価付けを⾏い ユーザーに届けます。 情報キュレーションサービス 「グノシー」 200媒体以上のニュースソースをベースに、 新たに開発した情報解析・配信技術を⽤いて⾃動的に 選定したニュースや情報をユーザーに届けます。 無料ニュース配信アプリ 「ニュースパス」
Slide 4
Slide 4 text
本⽇お話させていただく内容 今回のre:Inventで個⼈的に気になった新サービス (を、⾃社の状況と絡めながら)
Slide 5
Slide 5 text
Amazon Athena • S3上のデータにクエリ投げられるサービス – CSV, JSON, カラムナフォーマット – 通常のS3データ課⾦+読み込んだデータ量で課⾦ • GZIPやカラムナフォーマットで読み込みデータ量を抑えられる • 既に解説スライド・記事がたくさん上がっている – Gunosyでも使ってみたブログ書いています – もういいよね
Slide 6
Slide 6 text
社内のとあるデータフロー • ⼀部ではありますが Raw log bucket Hive Metastore Airflow ETL Cluster Parquet bucket Analysis Cluster Redash etc… Job
Slide 7
Slide 7 text
Amazon Athenaが⼊ると • こんな感じでしょうか Raw log bucket Hive Metastore Airflow ETL Cluster Parquet bucket Athena Redash etc… Job
Slide 8
Slide 8 text
でも、、 • Metastoreが別のため、別途DDL操作が必要 Raw log bucket Hive Metastore Airflow ETL Cluster Parquet bucket Athena Redash etc… Job 何か Add Partition etc… Metastore (Hive Compatible) 既存資産を 活⽤したい!
Slide 9
Slide 9 text
外部Metastoreの参照 ͝ݕ౼͓ئ͍͠·͢ʂ ʢػೳཁʣ
Slide 10
Slide 10 text
そういえば もうひとつ気になるものがありました
Slide 11
Slide 11 text
AWS Glue • Fully Managed ETL Service – Data Catalog • RDS/S3/Redshiftを統合 • JSON、CSV、Parquetなど、各種フォーマットに対応 – Job Authoring – Job Execution • 近⽇公開
Slide 12
Slide 12 text
ん…?これは…? ここから先は妄想です (だったらいいなシリーズ)
Slide 13
Slide 13 text
妄想)こんな感じでできたりしないかな…? • ETLジョブの実⾏・管理を全てGlueで – ジョブ管理をフルマネージドで • AthenaのMetastoreをGlueのData Catalogで – 資料にはAthena書いてませんが…サポートしてください! Raw log bucket Glue Parquet bucket Athena Redash etc… Glue Data Catalog
Slide 14
Slide 14 text
AWS GlueのAthena Support ͝ݕ౼͓ئ͍͠·͢ʂ ʢػೳཁʣ
Slide 15
Slide 15 text
AWS Glue ͓͖ͯ͞ɺ(MVFʹظ͍ͯ͠·͢ʂ ૣ͘ެ։͍ͯͩ͘͠͞ʂ
Slide 16
Slide 16 text
終わりに • ご清聴ありがとうございました