Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Let's BBQ !

Youkey
June 13, 2018

Let's BBQ !

Let's BBQ ! With us

Youkey

June 13, 2018
Tweet

More Decks by Youkey

Other Decks in Technology

Transcript

  1. すみか:ビッグデータ解析のコンサル会社経営(副業) Cavity LLC. Founder (Principal) GCP歴: 1年半(= BQ暦 ) しゅみ:分析解析での失敗

    / アボカド育てて食う Who am I ? 中田 祐樹 / Yuki Nakata ◦ 本業はGMOクラウド(株)のプリセールス ◦ 組込プログラマからSIerでSEを経て、BigQueryにはまる ◦ 計算社会科学が好きだけど、ほぼ無免許運転
  2. Copyright © 2018 Cavity.LLC All Rights Reserved. 会社概要 ➢社名 :

    Cavity合同会社(英:Cavity.LLC) ➢本社 : 滋賀県東近江市林町 ➢代表社員 : 中田 祐樹(CEO/CTO) ・ 小野 寛徳(COO) ➢設立 : 平成30年4月20日 ➢資本金 : 10円 ➢事業内容 : ビッグデータコンサルティング事業 ・ IaaSを用いたデータ活用コンサルティング ・ イベント運営、コミュニティ形成支援 ・ その他上記付帯事業、各種営業代行
  3. Copyright © 2018 Cavity.LLC All Rights Reserved. イベント告知 起業の科学 勉強会

    [2018/7/20(fri) in GMO yours大阪] https://startup-science.connpass.com/event/88128/ 「起業の科学 スタートアップサ イエンス/田所 雅之 (著)」 ・感銘を受け、読後同じ気持ちに なっている方と話をする会 ・場所はグランフロント大阪B棟 ・のちには各項での勉強会を予定 ・因みにCavity LLC.もここから
  4. データウェアハウス? • データの倉庫で、何らかの判断や分析材料として利用が主目的 • SAP/Oracleなどが代表格で、専門のSEが運用することも多い • データマイニングツールと呼ばれる分析ツールの利用 • データマートと呼ばれる利用目的別のDBを作るケースも多い (顧客情報(CRM)

    + 自社売上管理DB など) • DBとの決定的な違いは ◦ トランザクションレベルでの性能は期待しない ◦ 更新しない(する場合は追加、もしくはコピーで再度マート化 ◦ 削除なし(する場合はデータセットもろとも削除
  5. もう少しだけ基礎テスト 【公式ドキュメント】 無し 【サマリ】 8. simple_app.pyをマルチプロセス化 9. 同様にマルチスレッド化 10.SQLをたたくAPIを使おう ちょっとだけ手を入れて、時間掛かる処理が分散できるような下地にしたい

    ただ、中身は面倒なんで替えずにstackoverflowを見るサンプルのまま ロードデータが500MBあるようで、間違ったSELECTの連打は非常に危険なので、先にチェック
  6. ならば、SQLをどう変換しよう • 使うSQLをリスト化して持たせる • SQLを文法解釈して、自然言語解釈的にSQL変換 • SQLコンバータライブラリ作成 • できないので、SQLでは無くcsv/jsonでinsert 答え

    保守性最悪 どんだけ時間いるねん 本末転倒 標準ライブラリにあった気が・・・ list = [ “SELECT price FROM pricetable” , “SELECT customerID, company FROM customers” , “INSERT INTO Cardinfo (name,cardID,customerID,expiredate,dead)” , “UPDATE cardinfo SET expiredate=20991231 WHERE dead=1” , “DELETE FROM cardinfo” ]
  7. 時間切れ... • SDKのbqクライアントにpsqlみたいなSQLインタプリタが欲しい • BQサービスオブジェクトって同じがいいのか、別がいいのか • SQLコンバータ for BQを作るのは車輪の再発明なので回避 •

    APIメソッドに対してエントリポイント欲しい • サードパーティのライブラリ使えよ • BBQの普及で使うためならCloud DataLabかDataStudio • みなさんプログラムから、どうBQ使ってる? #欲しいばっかりで、ごめんなさい #やってる方いたら、懇親会で話させてくださいー